Does AI struggle with its confidence?
新的研究表明,诸如GPT-4O和Gemma 3之类的LLM即使在错误时也会坚持他们的初始答案 - 但在受到挑战时很快就会失去信心。过度自信和自我怀疑的这种令人惊讶的结合反映了人类的认知偏见,并引起了人们对AI可靠性的担忧。
Hidden bias in large language models
MIT科学家在AI语言模型中探索了一个称为位置偏见的关键缺陷,其中模型在文本的开头和末尾都偏向于忽略中间的信息。他们的研究表明,这种偏见不仅源于培训数据,而且还源于模型本身的架构。
AI eye matches human color perception
使用染料敏化的太阳能电池以10纳米的分辨率模仿人工突触可以模仿人类的色觉。该技术使能够具有高级颜色识别和逻辑处理的节能AI系统。
Real-life transformer: Drone morphs mid-air
atto是一个机器人,将空中从飞行无人机转变为地面流动站。通过克服混合机器人的长期挑战被困在粗糙的地形上,这一突破释放了自主交付,灾难响应和行星探索的新可能性。
AI learns to sync sight and sound
MIT研究人员开发了Cav-Mae Sync,这是一种AI模型,该模型学会了将声音与视频中的匹配视觉效果联系起来,而无需任何标签。这项技术可以使我们更接近更聪明的人工智能,就像人类一样,可以看到,听到和理解世界。
Google I/O 2025: AI at the core of everyday technology
Google I/O 2025上介绍的最迷人的创新揭示了AI如何改变搜索,视频创建和通信。这些进步是重新定义日常技术,使其比以往任何时候都更加聪明,更直观和个性化。
AI’s hallucination problem is getting worse
来自OpenAI和DeepSeek等科技巨头的最先进的AI模型正在以前所未有的速度生成虚假信息 - 没人知道为什么。由于AI幻觉的这种激增,跨关键领域的AI可靠性受到质疑。
Phi-4 – small models, big results
Microsoft的Phi-4家族是新一代的紧凑型语言模型,为数学,编码和计划等复杂任务建立,通常超过较大的系统。经过高级技术和精选数据培训,它们提供了强大的推理,同时又可以效率地用于低延迟使用。
No rules, just vibes! What is vibe coding?
为什么当AI可以通过开发为您“振动”时,为什么要强调代码的每一行? Vibe编码是一个快速增长的趋势,开发人员让AI在编写代码中占据主导地位,将编程转换为更直观和自发的过程。
NVIDIA just made game physics a playground for everyone
nvidia已正式制作了其Physx Engine和Flow SDK完全开源的,包括期待已久的GPU模拟内核代码,并在BSD-3许可下。现在,即使在非NVIDIA GPU上,开发人员也可以自定义,端口和复兴的高级物理模拟。
Midjourney V7: Faster, smarter, more realistic
MidJourney推出了V7,即迄今为止最强大的AI映像模型,具有更智能的提示和实时个性化。通过重新设计的体系结构,V7提供了改进的对象连贯性,增强的纹理现实主义,并引入了快速,具有成本效益的图像迭代的草稿模式。
Super-Turing AI: Learning like the human mind
模仿大脑学习过程的新的高级神经系统有望创造更快,更高效和节能的AI。通过利用Hebbian学习和依赖于峰值的可塑性,这一创新可以提高AI的性能,同时大大降低环境和经济成本。
AI tool enhances transparency in X-ray analysis
ITPCTRL-AI通过模仿放射科医生的凝视模式来改善X射线诊断,提供可解释的热图,从而提高对AI驱动的医学成像的透明度和信任。通过滤除无关紧要的数据并专注于关键诊断区域,该系统可确保更准确和可解释的结果。
GPT-4.5 – a leap forward in AI capabilities
gpt-4.5是Openai最先进的AI,具有改进的自然语言理解,增强的情绪智力和更直观的对话。它以书面形式,集思广益和解决问题的方式出色,同时最大程度地减少AI幻觉,以获得更可靠的结果。
Flying blind: How to navigate drones in total darkness
麻省理工学院的研究人员已经开发了Mifly,这是一种基于RF的低功耗系统,使无人机能够在完全黑暗,室内和低可见性条件下自定位。通过使用单个反向散射标签和双极化雷达,Mifly在不依赖视觉提示或外部基础架构的情况下导航。
NVIDIA Cosmos – the secret weapon behind AI robotics
nvidia cosmos通过产生逼真的3D环境来增强AI机器人技术,从而使开发人员能够在不依赖昂贵的真实世界数据的情况下训练自主系统。借助高级世界基础模型,Cosmos推动了机器人技术,自动驾驶汽车和工业自动化的创新。
The largest open-source AI model for video generation
Hunyuanvideo是视频生成的最大开源AI模型,拥有130亿个参数,以产生具有栩栩如生的运动和完美同步音频的高质量的电影视频。为AI驱动的内容创建设置新的基准,它提供了无与伦比的现实主义,精度和创造性的可能性。