研究人员开发出一种更快地训练机器人的技术

来自麻省理工学院 (MIT)、纽约大学 (NYU) 和加州大学伯克利分校 (UC Berkeley) 的一组研究人员创建了一个系统,可以让人们快速、轻松地教授机器人需要做什么。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

来自麻省理工学院 (MIT)、纽约大学 (NYU) 和加州大学伯克利分校 (UC Berkeley) 的一组研究人员创建了一个系统,可以让人们快速、轻松地教授机器人需要做什么。

麻省理工学院的新闻稿提供了一个将机器人运送到用户家中执行家务的示例。该机器人是在工厂中针对一组特定任务而创建和训练的,并且从未见过这栋特定房屋中的物体。如果你让他从厨房桌子上拿一个杯子,他可能无法完成这项任务,因为他不了解各种形状和颜色。

“现在,当我们训练这些机器人时,我们不知道它们为什么会失败。所以你只需举起双手说,‘好吧,我们必须重新开始。’” 关键部分该系统缺少的是机器人展示失败原因的能力,以便用户可以向他提供反馈。”麻省理工学院电气与计算机工程系 (EECS) 的研究生 Andy Peng 说道。

当机器人失败时,系统会使用一种算法来生成反事实,描述机器人需要做出哪些改变才能成功。例如,如果杯子是某种颜色,机器人也许可以拿起它。系统向人类展示这些反事实的解释,并要求他对机器人失败的原因发表意见。然后,系统使用此反馈生成新数据,用于微调机器人。

微调涉及更改经过训练以执行一项任务的机器学习模型,以便它可以执行第二项类似的任务。

研究人员在模拟器中测试了这项技术,发现它比其他方法更有效地训练机器人。使用这种方案训练的机器人显示出更好的结果,并且学习过程花费的时间比人类少。

结果