摘要:构建有效的模仿学习方法,使机器人能够从有限的数据中学习,并且仍然在不同的现实世界环境中概括是一个长期存在的问题。我们提出了Equibot,一种可用于机器人操纵任务学习的强大,有效且可推广的方法。我们的方法结合了SIM(3) - 等级神经网络体系结构与扩散模型。这确保了我们所学的政策对规模,轮换和翻译的变化是不变的,从而增强了它们对看不见的环境的适用性,同时保留了基于扩散的政策学习的好处,例如多种方式和鲁棒性。我们在一组6项模拟任务上显示,我们提出的方法减少了数据要求并改善对新方案的概括。在现实世界中,有10个移动操作任务的10个变体,我们表明我们的方法可以轻松地概括为每项任务中仅5分钟的人类演示的新颖对象和场景。网站:https://equi-bot.github.io/
主要关键词