详细内容或原文请订阅后点击阅览
一种更有效的多用途机器人技术
借助生成式人工智能模型,研究人员结合了来自不同来源的机器人数据,帮助机器人更好地学习。
来源:MIT新闻 _机器人假设您想训练一个机器人,让它了解如何使用工具,然后快速学会用锤子、扳手和螺丝刀修理房子。要做到这一点,您需要大量展示工具使用的数据。
现有的机器人数据集在形式上差异很大——例如,一些包括彩色图像,而另一些则由触觉印记组成。数据也可以在不同的领域收集,如模拟或人类演示。每个数据集可能捕获一个独特的任务和环境。
很难在一个机器学习模型中有效地整合来自如此多来源的数据,因此许多方法只使用一种类型的数据来训练机器人。但是,以这种方式训练的机器人,使用相对较少的任务特定数据,通常无法在陌生的环境中执行新任务。
为了训练更好的多用途机器人,麻省理工学院的研究人员开发了一种技术,使用一种称为扩散模型的生成式人工智能,将跨领域、模态和任务的多种数据源组合起来。
他们训练一个单独的扩散模型来学习使用一个特定数据集完成一项任务的策略或策略。 然后,他们将扩散模型学习到的策略组合成一个通用策略,使机器人能够在各种环境中执行多项任务。
在模拟和现实世界的实验中,这种训练方法使机器人能够执行多项工具使用任务并适应训练期间未见过的新任务。 与基线技术相比,这种方法称为策略组合 (PoCo),可将任务性能提高 20%。
关于 PoCo 的论文组合不同的数据集
组合不同的数据集用于学习机器人策略的数据集通常很小,并且专注于一项特定的任务和环境,例如将物品装入仓库中的箱子中。
扩散策略大于其各部分的总和
大于其各部分的总和