通过离线技能扩散___XiaoMi-AI 助力科研平台

通过离线技能扩散

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过离线技能扩散

¥ 1.0

热度

基于技能的强化学习（RL）方法已经表现出巨大的希望，尤其是在通过层次结构解决长期地平线任务时。这些技能是从离线数据集中学习的任务不足的，可以加速新任务的政策学习过程。然而，由于它们对数据集的固有依赖性，这些技能在不同领域中的应用仍受到限制，当试图通过与数据集域不同的目标域学习基于技能的策略时，它在尝试通过RL学习基于技能的策略时会构成挑战。在本文中，我们提出了一个新颖的离线技能学习框架 - 使用指导的扩散模型来产生从数据集中有限技能扩展的多功能技能，从而增强了对不同领域任务的策略学习的稳健性。具体而言，我们设计了一个基于扩散的技能解码器，并结合层次编码，以将技能嵌入空间分解为两个不同的表示，一种是用于构造域名行为的行为，另一个用于驱散行为中域变化的因素。我们的duskill框架增强了离线学习技能的多样性，从而可以加快针对不同领域的高级政策的学习过程。通过实验，我们表明，Duskill在几个长期任务中都超过了其他基于技能的模仿学习和RL算法，这表明了它的好处，并以几种模仿和在线RL表现出来。

添加pdf代下载 VIP点击下载文件

通过离线技能扩散

主要关键词

扩散模型解码器不同学习的不足的学习过程不同的多功能数据集技能扩散巨大的扩展的数据策略扩散的依赖性变化的离线层次结构指导的领域稳健性任务行为地平线 RL 学习用于

通过离线技能扩散PDF文件第1页

通过离线技能扩散PDF文件第2页

通过离线技能扩散PDF文件第3页

通过离线技能扩散PDF文件第4页

通过离线技能扩散PDF文件第5页

可下载资源数量

已经购买

下载数量：1

通过离线技能扩散

通过离线技能扩散

相关文件推荐

扩散

软技能

技能测试

从扩散MRI

通过技能和...

diffradar：扩散

基于扩散MRI

未来技能报告

针对4-H的生活技能

未来技能的协作

业务技能

基于扩散张量成像

通过扩散扩散性

国家技能协议

技能状态

计算机技能

技能契约

从扩散MRI

技能展望

扩散40年

技能通讯

技能工坊

“技术扩散”

功能技能

计算技能

技能总结

更高技能战略

乳腺癌如何扩散？

技能未来工读学位

十大大脑技能

XiaoMi-AI