近年来,随着众多能够创造出具有智能剂的技术的兴起,增强学习(RL)的增长已经显着增长。每当我们提供合适的学习环境和明确定义的目标时,这些代理人就可以解决众多的顺序决策问题。尽管如此,在某些现实世界中应用这些算法仍然很困难:RL在很大程度上依赖奖励功能,并且这种信号的设计通常很麻烦。此外,RL的反复试验性质使其成为一种极其摄入的技术,在训练的第一个时期中具有接近随机的方式。这些限制使通过RL学习不适合现实世界环境,因为在这些情况下,低绩效行为是不可接受的,收集样本很昂贵(就时间或实际成本而言)。在某些情况下,专家们同意,要克服上面显示的challenges,它更容易演示DeSired行为,而不是手动设计它或尝试从头开始学习它。通过试图模拟给名的演示来进行学习过程称为模仿学习(IL)。此re-
主要关键词