Loading...
机构名称:
¥ 1.0

摘要 - 深入强化学习(RL)在人机协作(HRC)中首次尝试在机器人运动计划中显示出令人鼓舞的结果。但是,在保证安全的限制下对HRC的RL方法进行了公平的比较。因此,我们现在是人类机器人体育馆,这是HRC安全RL的基准套件。我们在模块化模拟框架中提供具有挑战性的现实HRC任务。最重要的是,人类机器人健身房是第一间基准套件,其中包括安全盾牌,可证明可以保证人体安全。这弥合了理论RL研究与其现实世界部署之间的关键差距。我们对六项任务的评估导致了三个关键结果:(a)人类机器人体育馆提供的任务的多样性为最先进的RL方法创造了一个具有挑战性的基准,(b)利用采取行动模仿奖励的专家知识,RL代理人可以超越专家,以及(C)我们的Angents超越训练数据。

人机健身房:在人机协作中进行基准测试加强学习

人机健身房:在人机协作中进行基准测试加强学习PDF文件第1页

人机健身房:在人机协作中进行基准测试加强学习PDF文件第2页

人机健身房:在人机协作中进行基准测试加强学习PDF文件第3页

人机健身房:在人机协作中进行基准测试加强学习PDF文件第4页

人机健身房:在人机协作中进行基准测试加强学习PDF文件第5页

相关文件推荐

2021 年
¥1.0