无限视野的深度加固学习...___XiaoMi-AI 助力科研平台

无限视野的深度加固学习...

可下载资源数量

已经购买

下载数量：1

单价	0 3.0
Coupon	100% 0%
Total	0 3.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

无限视野的深度加固学习...

¥ 3.0

热度

摘要。我们介绍了旨在以统一的方式解决连续空间均值场（MFG）和平均场控制（MFC）问题的增强学习算法的开发和分析。所提出的方法通过参数化的分数函数将参与者 - 批判性（AC）范式与平均场分布的表示形式配对，可以以在线方式进行有效更新，并使用Langevin Dynamics从产生的分布中获取样品。AC代理和分数函数被迭代更新以收敛到MFG平衡或给定平均领域问题的MFC Optimum，具体取决于学习率的选择。算法的直接修改使我们能够求解混合的均值场控制游戏。使用在有限的地平线框架中使用线性界面基准来评估我们的算法的性能。

添加pdf代下载 VIP点击下载文件