详细内容或原文请订阅后点击阅览
Google DeepMind 正在使用 Gemini 在模拟山羊 3 中训练智能体
Google DeepMind 构建了一种名为 SIMA 2 的新型视频游戏代理,可以在各种 3D 虚拟世界中导航和解决问题。该公司声称这是朝着更通用的代理和更好的现实世界机器人迈出的一大步。谷歌 DeepMind 去年首次演示了 SIMA(代表“可扩展、可指导的多世界代理”)。但是……
来源:MIT Technology Review _人工智能研究人员声称 SIMA 2 可以在虚拟世界中执行一系列更复杂的任务,弄清楚如何自行解决某些挑战,并与用户聊天。它还可以通过多次解决更困难的任务并通过反复试验来学习来提高自己。
“长期以来,游戏一直是智能体研究背后的推动力,”谷歌 DeepMind 的研究科学家 Joe Marino 在本周的新闻发布会上表示。他指出,即使是游戏中的一个简单动作,例如点亮灯笼,也可能涉及多个步骤:“这是一组非常复杂的任务,你需要解决才能取得进展。”
最终目标是开发下一代代理,使其能够遵循指令并在比网络浏览器更复杂的环境中执行开放式任务。从长远来看,谷歌 DeepMind 希望使用此类代理来驱动现实世界的机器人。 Marino 声称 SIMA 2 学到的技能,例如环境导航、使用工具以及与人类合作解决问题,是未来机器人伴侣的重要组成部分。
与之前关于游戏智能体的工作不同,例如 AlphaZero(在 2016 年击败了围棋大师)或 AlphaStar(在 2019 年视频游戏《星际争霸 2》中击败了 99.8% 的排名人类选手),SIMA 背后的想法是训练智能体在没有预设目标的情况下玩开放式游戏。相反,代理学习执行人们发出的指令。
击败了 99.8% 的排名人类竞赛玩家人们通过文本聊天、大声说话或在游戏屏幕上画画来控制 SIMA 2。该代理逐帧接收视频游戏的像素,并计算出执行其任务需要采取哪些操作。
与其前身一样,SIMA 2 也使用人类玩八款商业视频游戏(包括《无人深空》和《模拟山羊 3》)以及该公司创建的三个虚拟世界的镜头进行训练。代理学会将键盘和鼠标输入与操作相匹配。
