详细内容或原文请订阅后点击阅览
法学硕士帮助机器人理解模糊的指令并专注于关键细节
为了帮助机器人在家庭和工厂等地方做家务,麻省理工学院的一种新方法使用一种语言模型来澄清用户的指令,然后使用另一种语言模型来忽略不相关的信息。
来源:MIT新闻 - 人工智能想象一下在不久的将来的某个时候在仓库或办公室工作,您被要求帮助新学员学习其工作的基础知识。问题是:它是一个机器人。为了教他们,你可能想玩一个“展示和讲述”的游戏——也就是说,用身体展示如何用几种不同的方式做某事,同时也解释你在做什么。
假设您在 Zoom 通话期间要求机器人在您的办公桌上放一些咖啡而不打扰您。您会希望机器人不要离您和笔记本电脑太近,以免打扰您的会议。为了实现这种行为,机器人应该接受能够清楚地展示完整任务的数据的训练。计算机科学家试图通过记录大量物理演示或编写大量说明来向机器人解释操作任务。但如果两者都没有,机器可能会误解它需要做什么。
人类完成所有这些展示和讲述是很费力的,因此麻省理工学院计算机科学和人工智能实验室 (CSAIL) 的研究人员已经实现了机器人教学过程的自动化,同时自动澄清指令并使用了近五倍的演示数据。他们的“Masked Inverse Reinforcement Learning”(Masked IRL)方法使用大型语言模型(LLM)根据从用户演示中收集的数据来详细说明不明确的提示。然后,另一位法学硕士缩小了算法应纳入运动计划的细节,以便机器人可以安全地完成家庭、办公室和工厂的家务活。
“当人类与机器人互动但又不想详细说明任务的所有细节时,我们的方法可能会派上用场,”麻省理工学院博士生兼 CSAIL 研究员 Minyoung Hwang 说道,他是介绍该项目的论文的主要作者。 “我们通过让机器深入了解用户真正想要的东西来最大限度地减少人力。”
