Loading...
机构名称:
¥ 1.0

近年来,随着众多能够创造出具有智能剂的技术的兴起,增强学习(RL)的增长已经显着增长。每当我们提供合适的学习环境和明确定义的目标时,这些代理人就可以解决众多的顺序决策问题。尽管如此,在某些现实世界中应用这些算法仍然很困难:RL在很大程度上依赖奖励功能,并且这种信号的设计通常很麻烦。此外,RL的反复试验性质使其成为一种极其摄入的技术,在训练的第一个时期中具有接近随机的方式。这些限制使通过RL学习不适合现实世界环境,因为在这些情况下,低绩效行为是不可接受的,收集样本很昂贵(就时间或实际成本而言)。在某些情况下,专家们同意,要克服上面显示的challenges,它更容易演示DeSired行为,而不是手动设计它或尝试从头开始学习它。通过试图模拟给名的演示来进行学习过程称为模仿学习(IL)。此re-

Integrating Behavioral Cloning into a Reinforcement Learning pipeline

Integrating Behavioral Cloning into a Reinforcement Learning pipelinePDF文件第1页

Integrating Behavioral Cloning into a Reinforcement Learning pipelinePDF文件第2页

Integrating Behavioral Cloning into a Reinforcement Learning pipelinePDF文件第3页

Integrating Behavioral Cloning into a Reinforcement Learning pipelinePDF文件第4页

Integrating Behavioral Cloning into a Reinforcement Learning pipelinePDF文件第5页

相关文件推荐

2024 年
¥2.0