详细内容或原文请订阅后点击阅览
双子座机器人技术将AI带入物理世界
引入双子座机器人技术和双子座机器人技术,AI模型旨在机器人理解,采取行动和反应物理世界。
来源:DeepMind - 新闻与博客模型
双子座机器人技术将AI带入物理世界
- 出版于2025年3月2日authorscarolina parada
介绍Gemini Robotics,我们的GEMINI 2.0模型设计用于机器人技术
在Google DeepMind上,我们一直在通过跨文本,图像,音频和视频的多模式推理来解决复杂的问题如何解决复杂问题。但是,到目前为止,这些能力主要局限于数字领域。为了使AI对物理领域的人们有用且有帮助,他们必须表现出“体现”的推理 - 人类式的理解和对我们周围世界的反应的能力,并安全采取行动来完成事情。
今天,我们正在基于Gemini 2.0介绍两个新的AI模型,这为新一代有用的机器人奠定了基础。
第一个是Gemini Robotics,这是一种高级视觉语言动作(VLA)模型,它是在Gemini 2.0上构建的,并添加了物理动作作为新的输出模式,以直接控制机器人。第二个是Gemini Robotics-ER,这是一种具有高级空间理解的双子座模型,使机器人主义者能够使用双子座的体现推理(ER)能力来运行自己的程序。
这两个模型都使各种机器人能够比以往任何时候都执行更广泛的现实世界任务。作为我们努力的一部分,我们正在与Apptronik合作,使用Gemini 2.0建立下一代的人形机器人。我们还与选定数量的受信任的测试人员合作,以指导Gemini Robotics-ER的未来。
我们期待探索模型的功能,并继续在实现现实应用程序的道路上开发它们。
双子座机器人技术:我们最先进的视觉语言行动模型
尽管我们以前的工作在这些领域展示了进展,但双子座机器人技术在所有三个轴上都代表了性能的重要一步,使我们更接近真正的通用机器人。
一般性
我们的技术报告互动性
敏捷