摘要 - 发现模型正在迅速改善机器人在自动执行日常任务(例如膳食准备)中的可容纳能力,但是由于模型性能,捕获用户偏好的难度以及对用户代理的需求,人类仍需要指示人类指导机器人。机器人可以使用各种方法指导 - 自然语言传达了即时的说明,但可以是抽象的或模棱两可的,而最终用户编程则支持更长的地平线任务,但接口面临捕获用户意图的困难。在这项工作中,我们建议将图像直接操纵作为替代范式来指导机器人,并介绍一个名为ImageInthat的特定实例化,该实例化允许用户在时间表式接口中对图像进行直接操纵,以生成机器人指令。通过用户研究,我们演示了ImageInthat在厨房操作任务中指导机器人的功效,并将其与基于文本的自然语言指令方法进行比较。结果表明,参与者使用ImageInthat的速度更快,并且更喜欢在基于文本的方法上使用它。补充材料,包括代码,请参见:https://image-in-that.github.io/。索引术语 - 用户机器人编程,直接操纵,机器人指令
主要关键词