Loading...
机构名称:
¥ 1.0

摘要 - 从演示中学习(LFD)允许机器人从人类用户学习技能,但是由于次优教学,尤其是未经训练的示威者,其有效性可能会受到影响。活跃的LFD旨在通过让机器人积极要求演示来增强学习来改善这一点。但是,这可能会导致各种任务情况之间的频繁上下文切换,从而增加了人类的认知负载并将错误引入演示。此外,很少有活跃的LFD研究研究这些主动查询策略如何影响人类教学以外的用户体验以外的方面,这对于开发有利于机器人学习和人类教学的算法至关重要。为了应对这些挑战,我们提出了一种活跃的LFD方法,该方法通过课程学习(CL)优化了在线人类示范的查询顺序,在该方法中,示威者被指导在逐渐增加困难的情况下提供示范。我们在四个模拟的机器人任务中评估了我们的方法,并进行了稀疏的奖励,并进行用户研究(n = 26),以研究主动LFD方法对人类教学方面的教学绩效的影响,导致教学后教学适应性和教学可转移性。我们的结果表明,与其他三种LFD基准相比,就融合政策和样本效率的最终成功率而言,我们的方法显着提高了学习绩效。此外,我们的用户研究结果表明,我们的方法大大减少了人类示威者所需的时间,并减少了失败的演示尝试。与另一个活跃的LFD基线相比,它还可以增强在可见和看不见的情况下的指导后人类教学,这表明教学表现增强,更大的后指导教学适应性以及通过我们的方法实现的更好的教学可转移性。索引术语 - 从示范中学习;课程学习;积极的模仿学习;人类在环境中

主动机器人课程从在线人类演示中学习

主动机器人课程从在线人类演示中学习PDF文件第1页

主动机器人课程从在线人类演示中学习PDF文件第2页

主动机器人课程从在线人类演示中学习PDF文件第3页

主动机器人课程从在线人类演示中学习PDF文件第4页

主动机器人课程从在线人类演示中学习PDF文件第5页

相关文件推荐

2025 年
¥2.0
2025 年
¥3.0
2024 年
¥26.0
2024 年
¥4.0
2024 年
¥24.0
2023 年
¥15.0
2025 年
¥2.0
2024 年
¥1.0