RoboCat:自我改善的机器人毒剂

机器人迅速成为我们日常生活的一部分,但是它们通常只能编程为可以很好地执行特定任务。尽管利用AI的最新进展可能会导致机器人可以以许多方式有所帮助,但在建造通用机器人方面的进展部分较慢,部分原因是收集现实世界中的培训数据所需的时间。我们的最新论文介绍了一种自动提高机器人技术的AI代理机器人,该代理商学会了在不同的武器上执行各种任务,然后自我生成新的培训数据以改善其技术。

来源:DeepMind - 新闻与博客

研究

RoboCat:自我改善的机器人毒剂

于2023年6月20日发布
已发布
2023年6月20日
作者
RoboCat团队

新的基金会代理人学会操作不同的机器人臂,从100个演示中解决任务,并从自我生成的数据中得到改善。

机器人迅速成为我们日常生活的一部分,但是它们通常只能编程为可以很好地执行特定任务。尽管利用AI的最新进展可能会导致机器人可以以许多方式有所帮助,但在建造通用机器人方面的进展部分较慢,部分原因是收集现实世界中的培训数据所需的时间。

我们的最新论文介绍了一种自我提出的机器人技术AI代理Robocat,该代理商学会了在不同的武器上执行各种任务,然后自我生成新的培训数据以改善其技术。

我们的最新论文

先前的研究已经探索了如何开发可以按大规模学习多任务的机器人,并将对语言模型的理解与助手机器人的真实能力相结合。 RoboCat是第一个解决和适应多个任务的代理商,并在不同的真实机器人上进行。

可以按比例学习多任务的机器人 将对语言模型的理解与现实世界功能结合在一起

RoboCat的学习速度比其他最先进的模型要快得多。它可以从100个演示中获得一项新任务,因为它从一个大而多样的数据集中汲取了灵感。这种能力将有助于加速机器人研究,因为它减少了对人类监督培训的需求,并且是创建通用机器人的重要一步。

RoboCat如何改善自己

RoboCat基于我们的多模型Gato(西班牙语“ CAT”),该模型可以在模拟和物理环境中处理语言,图像和动作。我们将Gato的体系结构与大量培训数据集结合在一起,包括各种机器人武器的序列和动作,以解决数百个不同的任务。

Gato 左: 正确: