Loading...
机构名称:
¥ 1.0

从演示中学习是用户教机器人的常见方法,但它很容易出现虚假的特征相关性。最近的工作构建了状态抽象,即具有与任务相关特征的视觉表示,从语言作为执行更具概括性学习的方式。但是,这些抽象还取决于用户对任务中重要的内容的偏好,而单独使用语言可能很难描述或不可证明。我们如何构建抽象来捕获这些潜在偏好?我们观察到人类的行为如何揭示了他们如何看待世界。我们的关键见解是,人类行为的变化告诉我们,人类如何看待世界的偏好存在差异,即他们的状态抽象。在这项工作中,我们建议使用语言模型(LMS)查询直接知道行为发生变化的偏好。在我们的框架中,我们以两种方式使用LM:首先,给定对任务的文字描述和状态之间行为变化的知识,我们向LM查询可能的隐藏偏好;其次,考虑到最可能的偏好,我们询问LM以构建状态抽象。在这个框架中,LM还可以直接询问人类自己的估计。我们证明了我们的框架在模拟实验,用户研究以及执行移动操纵任务的真实斑点机器人中构建有效的偏好条件抽象的能力。

偏好条件的语言指导抽象

偏好条件的语言指导抽象PDF文件第1页

偏好条件的语言指导抽象PDF文件第2页

偏好条件的语言指导抽象PDF文件第3页

偏好条件的语言指导抽象PDF文件第4页

偏好条件的语言指导抽象PDF文件第5页

相关文件推荐

2025 年
¥1.0
2024 年
¥1.0
2025 年
¥1.0
2022 年
¥2.0
2023 年
¥4.0
2024 年
¥2.0
2024 年
¥1.0
1900 年
¥1.0
2023 年
¥2.0
2008 年
¥3.0
2023 年
¥1.0
2024 年
¥1.0
2019 年
¥1.0
2020 年
¥1.0
2022 年
¥1.0
2021 年
¥2.0
2023 年
¥1.0
2021 年
¥17.0