在增强学习中塑造稀疏的奖励___XiaoMi-AI 助力科研平台

在增强学习中塑造稀疏的奖励

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

在增强学习中塑造稀疏的奖励

¥ 1.0

热度

在许多现实世界中，代理商的奖励信号非常稀疏，这使得学习有效的奖励功能以进行奖励构成挑战。为了解决这个问题，我们的方法不仅可以通过非零奖励过渡，而且还采用半监督学习（SSL）技术（SSL）技术以及新的数据增强来学习轨迹空间代表性，从大多数过渡，从而提高奖励奖励Shaping Shaping shaping shaping shaping shaping shaping。Atari和机器人操作中的实验结果表明，我们的方法有效地将奖励概括为稀疏的奖励场景，与好奇心驱动的方法相比，达到更高的最佳分数表现。拟议的双熵数据增强增强了性能，显示出比其他增强方法的最佳分数提高15.8％。

添加pdf代下载 VIP点击下载文件

在增强学习中塑造稀疏的奖励

主要关键词

过渡实验结果奖励机器人提高 Shaping 稀疏有效的 shaping 增强分数数据代理商学习实验构成操作方法 SSL 驱动的

在增强学习中塑造稀疏的奖励PDF文件第1页

在增强学习中塑造稀疏的奖励PDF文件第2页

在增强学习中塑造稀疏的奖励PDF文件第3页

在增强学习中塑造稀疏的奖励PDF文件第4页

在增强学习中塑造稀疏的奖励PDF文件第5页

可下载资源数量

已经购买

下载数量：1

在增强学习中塑造稀疏的奖励

在增强学习中塑造稀疏的奖励

相关文件推荐

稀疏奖励的合作多代理增强学习

通过增强学习

增强学习

逆增强学习

离线增强学习

增强学习中的评估

进化增强学习

通过语言模型评论家浓厚的奖励增强增强学习

技术增强学习

使用深厚的增强学习

训练扩散模型通过增强学习

扩散模型的大规模增强学习

值得信赖的增强学习

adaptaug：多代理增强学习

双曲线空间中的增强学习

多代理增强 - 学习（MARL）

通过随机镜下降的逆增强学习

通过深入的增强学习和递归

竞争学习生成稀疏

监督学习中的稀疏活动和稀疏连接

利用人工智能增强学习

增强个性化学习体验

跨环境高参数调谐用于增强学习

学习通过增强学习来控制相机曝光

通过加强学习来增强财务风险管理

电网中的图形增强学习：调查

损失函数在增强学习中的核心作用

Andrew V. Sutherland稀疏的自动编码器用于增强学习模型中的可解释性

自主驾驶的多机构增强学习

奖励情绪学习和氯胺酮研究

XiaoMi-AI