我们建立通用AI助手的愿景

Gemini 2.5是我们最聪明的AI模型,现在内置的思维。

来源:DeepMind - 新闻与博客

在过去的十年里,我们为现代人工智能时代奠定了很多基础,从开创所有大型语言模型所基于的 Transformer 架构,到开发像 AlphaGo 和 AlphaZero 这样能够学习和规划的代理系统。

变压器 AlphaGo AlphaZero

我们应用这些技术在量子计算、数学、生命科学和算法发现方面取得了突破。我们继续加倍加强基础研究的广度和深度,致力于创造通用人工智能 (AGI) 所需的下一个重大突破。

量子计算 数学 生命科学 算法发现

这就是为什么我们正在努力扩展我们最好的多模态基础模型 Gemini 2.5 Pro,使其成为一个“世界模型”,它可以像大脑一样通过理解和模拟世界的各个方面来制定计划和想象新的体验。

一段时间以来,我们一直在这个方向上取得进展,从我们的开创性工作训练代理来掌握围棋和星际争霸等复杂游戏,到构建 Genie 2,它能够通过单个图像提示生成您可以与之交互的 3D 模拟环境。

星际争霸 精灵2

我们已经可以看到这些能力的证据,包括 Gemini 使用世界知识和推理来表示和模拟自然环境的能力、Veo 对直观物理学的深刻理解,以及 Gemini Robotics 教机器人掌握、遵循指令和动态调整的方式。

模拟自然环境 维奥 双子座机器人

让 Gemini 成为世界模型是开发一种新的、更通用、更有用的人工智能(通用人工智能助手)的关键一步。这是一种智能人工智能,能够理解您所处的环境,并且可以在任何设备上代表您进行计划和采取行动。