RoboCat:一个自我改进的机器人代理

机器人正迅速成为我们日常生活的一部分,但它们通常只被编程为能够很好地执行特定任务。虽然利用人工智能的最新进展可以制造出能够以更多方式提供帮助的机器人,但制造通用机器人的进展较慢,部分原因是需要时间来收集现实世界的训练数据。我们最新的论文介绍了一种用于机器人的自我改进的人工智能代理 RoboCat,它可以学习通过不同的手臂执行各种任务,然后自我生成新的训练数据来改进其技术。

来源:DeepMind - 新闻与博客

研究

RoboCat:一个自我改进的机器人代理

已发布 2023 年 6 月 20 日作者 RoboCat 团队
已发布
2023 年 6 月 20 日
作者
RoboCat 团队

RoboCat 团队

新的基础代理学习操作不同的机械臂,从少至 100 次演示中解决任务,并从自生成的数据中进行改进。

机器人正在迅速成为我们日常生活的一部分,但它们通常只被编程为能够很好地执行特定任务。虽然利用人工智能的最新进展可以制造出能够以更多方式提供帮助的机器人,但通用机器人的制造进展较慢,部分原因是需要时间来收集现实世界的训练数据。

我们最新的论文介绍了一种用于机器人的自我改进的人工智能代理 RoboCat,它可以学习通过不同的手臂执行各种任务,然后自我生成新的训练数据来改进其技术。

我们最新的论文

先前的研究探索了如何开发能够学习大规模多任务的机器人,并将对语言模型的理解与助手机器人的实际能力相结合。 RoboCat 是第一个解决和适应多项任务的代理,并且可以跨不同的真实机器人执行此操作。

能够大规模学习多任务的机器人 将对语言模型的理解与现实世界的能力相结合

RoboCat 的学习速度比其他最先进的模型快得多。它可以从大量多样化的数据集中提取数据,仅用 100 次演示就可以掌握一项新任务。这种能力将有助于加速机器人研究,因为它减少了对人工监督训练的需求,是创建通用机器人的重要一步。

RoboCat 如何自我改进

RoboCat 基于我们的多模态模型 Gato(西班牙语中的“猫”),它可以在模拟和物理环境中处理语言、图像和动作。我们将 Gato 的架构与一个大型训练数据集相结合,该数据集包含各种机器人手臂的图像序列和动作,可解决数百种不同的任务。

Gato 左: