Integrating Behavioral Cloning into a Reinforcement Learning pipeline__

Integrating Behavioral Cloning into a Reinforcement Learning pipeline

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

Integrating Behavioral Cloning into a Reinforcement Learning pipeline

¥ 1.0

热度

近年来，随着众多能够创造出具有智能剂的技术的兴起，增强学习（RL）的增长已经显着增长。每当我们提供合适的学习环境和明确定义的目标时，这些代理人就可以解决众多的顺序决策问题。尽管如此，在某些现实世界中应用这些算法仍然很困难：RL在很大程度上依赖奖励功能，并且这种信号的设计通常很麻烦。此外，RL的反复试验性质使其成为一种极其摄入的技术，在训练的第一个时期中具有接近随机的方式。这些限制使通过RL学习不适合现实世界环境，因为在这些情况下，低绩效行为是不可接受的，收集样本很昂贵（就时间或实际成本而言）。在某些情况下，专家们同意，要克服上面显示的challenges，它更容易演示DeSired行为，而不是手动设计它或尝试从头开始学习它。通过试图模拟给名的演示来进行学习过程称为模仿学习（IL）。此re-

添加pdf代下载 VIP点击下载文件