Loading...
机构名称:
¥ 2.0

针对老年人和残疾人的机器人助手需要在协作任务中与用户互动。这些系统的核心组成部分是一个交互管理者,其工作是观察和评估任务并推断人的状态以及他们为机器人选择最佳行动方案的意图。由于该域中数据的稀疏性,这种多模式系统的策略通常是手工制定的。随着相互作用的复杂性的增长,此过程是不可扩展的。本文提出了一种加固学习(RL)方法,以自动生成机器人的多模式策略。与传统的对话系统相比,我们的代理人经过使用人类数据的模拟器进行培训,并且可以处理多种模式,例如语言和物理动作。我们使用一个简单的高级奖励功能,不需要微调并执行一些先决条件来加快训练过程。我们进行了一项人类研究,以评估系统在与用户互动中的性能。我们设计的系统在真实用户使用时显示出令人鼓舞的初步结果。

与人类合作的机器人的多模式增强学习

与人类合作的机器人的多模式增强学习PDF文件第1页

与人类合作的机器人的多模式增强学习PDF文件第2页

与人类合作的机器人的多模式增强学习PDF文件第3页

与人类合作的机器人的多模式增强学习PDF文件第4页

与人类合作的机器人的多模式增强学习PDF文件第5页

相关文件推荐

2021 年
¥5.0
2025 年
¥2.0
2024 年
¥1.0
2025 年
¥2.0
2025 年
¥3.0
2021 年
¥1.0
2021 年
¥3.0
2023 年
¥1.0
2024 年
¥2.0
2023 年
¥2.0
1900 年
¥1.0
2024 年
¥5.0
2019 年
¥3.0