跨环境高参数调谐用于增强学习__

跨环境高参数调谐用于增强学习

可下载资源数量

已经购买

下载数量：1

单价	0 2.0
Coupon	100% 0%
Total	0 2.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

跨环境高参数调谐用于增强学习

¥ 2.0

热度

本文介绍了一种新的经验方法，即交叉环境超参数调谐基准，该方法使用单个超参数设置比较了环境之间的RL算法，从而鼓励算法开发对超级参数不敏感。我们证明，即使使用了很少的样品，这种基准对统计噪声具有鲁棒性，并且在重复的范围中获得了定性相似的结果。这种鲁棒性使得基准计算上的计算便宜，从而可以以低成本的统计良好见解。我们在一组六个小型控制环境（SC-CHTB）以及28个环境（DMC-CHTB）的整个DM控制套件上演示了CHTB的两个示例实例。最后，为了说明CHTB对现代RL算法的适用性，我们对连续控制文献中的一个开放问题进行了新的经验研究。我们充满信心地表明，Ornstein-Uhlenbeck噪声和不相关的高斯噪声在DMC-CHTB上使用DDPG算法探索没有有意义的差异。

添加pdf代下载 VIP点击下载文件

跨环境高参数调谐用于增强学习

主要关键词

低成本的环境 CHTB 鲁棒性高斯噪声 DMC 控制使用参数算法经验噪声相似的低成本重复的 RL 方法相关的计算不相关的不敏感连续控制适用性基准统计噪声

跨环境高参数调谐用于增强学习PDF文件第1页

跨环境高参数调谐用于增强学习PDF文件第2页

跨环境高参数调谐用于增强学习PDF文件第3页

跨环境高参数调谐用于增强学习PDF文件第4页

跨环境高参数调谐用于增强学习PDF文件第5页

可下载资源数量

已经购买

下载数量：1

跨环境高参数调谐用于增强学习

跨环境高参数调谐用于增强学习

相关文件推荐

通过增强学习

增强学习

逆增强学习

使用 ECERS-3 来增强基于游戏的学习环境

增强学习基于复杂环境中蛇机器人的运动控制

离线增强学习

增强学习中的评估

进化增强学习

用于建模碎屑环境

技术增强学习

市场参数增强

用于药物发现的知识增强表征学习

使用深厚的增强学习

训练扩散模型通过增强学习

扩散模型的大规模增强学习

环境对抗强化学习

选择性学习，用于多...

值得信赖的增强学习

adaptaug：多代理增强学习

双曲线空间中的增强学习

多代理增强 - 学习（MARL）

通过随机镜下降的逆增强学习

通过深入的增强学习和递归

替代学习环境 (ALE) 指南

参数增强收入策略

学习环境学习者小册子

学习环境学习者小册子

学习环境中的多媒体有效性

第 1 部分：学习环境 - CACREP

利用人工智能增强学习

XiaoMi-AI