详细内容或原文请订阅后点击阅览
教会机器人极限,安全地完成开放式任务
“PRoC3S” 方法通过模拟测试每个步骤帮助法学硕士制定可行的行动计划。这一策略最终可以帮助家用机器人完成更模糊的家务要求。
来源:MIT新闻 - 人工智能如果有人建议你“了解自己的极限”,他们很可能是在建议你适度锻炼。但对于机器人来说,这句格言代表着学习约束,或机器环境中特定任务的限制,以便安全正确地完成家务。
例如,想象一下,当机器人不了解周围环境的物理特性时,要求它打扫厨房。机器如何生成一个实用的多步骤计划来确保房间一尘不染?大型语言模型 (LLM) 可以接近目标,但如果模型仅接受文本训练,它可能会错过有关机器人物理约束的关键细节,例如它可以到达多远或附近是否有需要避开的障碍物。如果只坚持 LLM,你最终可能会清除掉地板上的意大利面污渍。
为了指导机器人执行这些开放式任务,麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员使用视觉模型来查看机器附近的情况并对其约束进行建模。该团队的策略包括法学硕士起草一份计划,并在模拟器中进行检查以确保其安全且切合实际。如果该操作序列不可行,语言模型将生成一个新计划,直到找到机器人可以执行的计划。
这种反复试验的方法被研究人员称为“通过代码进行机器人规划以实现连续约束满足”(PRoC3S),它测试长期计划以确保它们满足所有约束,并使机器人能够执行各种任务,例如书写单个字母、画星星以及对积木进行分类和放置在不同位置。未来,PRoC3S 可以帮助机器人在房屋等动态环境中完成更复杂的家务,在这种环境中,它们可能会被提示做由许多步骤组成的一般家务(例如“给我做早餐”)。
该团队的工作成果于上个月在德国慕尼黑举行的机器人学习会议 (CoRL) 上发表的一篇论文中发表。
“LLM3”