摘要 - 从演示中学习的核心挑战是生成适应能力并可以推广到看不见的情况的表示。这项工作建议在不使用特定于任务的启发式方法的情况下学习这种表示形式,而在全球框架中叠加本地技能,在多次参考框架技能学习的背景下。首先通过使用高斯流程(GPS)拟合相对技能来了解本地政策。然后,另一个GP决定了每个帧与每个时间步的相关性,它是从不同批次的演示中以自我监督的方式训练的。GP的不确定性定量能力被利用以稳定当地政策并以完全贝叶斯的方式训练框架相关性。我们通过在模拟中生成的多帧任务的数据集以及具有机器人操作的拾取和位置重新封闭任务的真实实验中生成的多帧任务。我们用两个指标评估了方法的性能:生成的轨迹与每个任务目标以及这些轨迹和测试专家轨迹之间的偏差有多近。根据这两个指标,所提出的方法始终优于最先进的基线,任务参数化的高斯混合模型(TPGMM)。
主要关键词