Morpion Solitaire的深度加固学习___XiaoMi-AI 助力科研平台

Morpion Solitaire的深度加固学习

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

Morpion Solitaire的深度加固学习

¥ 1.0

热度

摘要。基于蒙特 - 卡洛算法的效率很大程度上依赖于随机搜索启发式，该搜索通常是使用域知识手工制作的。为了提高这些方法的通用性，新算法（例如嵌套推出策略适应（NRPA））已使用在搜索过程中收集的数据在线培训的手工制作的启发式方法代替了手工制作的启发式方法。尽管策略模型的表现力有限，但NRPA还是能够超过传统的蒙特卡洛算法（即不学习）在包括Morpion Solitaire在内的各种游戏中。在本文中，我们将蒙特卡罗搜索与基于事先训练的神经网络的更加紧迫的非线性策略模型相结合。然后，我们演示了如何使用此网络以通过Morpion Solitaire游戏的这种新技术获得最先进的结果。我们还使用NeuralNRPA作为专家来培训专家迭代的模型。

添加pdf代下载 VIP点击下载文件

Morpion Solitaire的深度加固学习

主要关键词

迭代的培训传统的通用性收集的策略训练的非线性手工 NRPA 使用先进的提高模型 Morpion 搜索 Solitaire 方法模型的专家制作在内的神经网络算法启发式

Morpion Solitaire的深度加固学习PDF文件第1页

Morpion Solitaire的深度加固学习PDF文件第2页

Morpion Solitaire的深度加固学习PDF文件第3页

Morpion Solitaire的深度加固学习PDF文件第4页

Morpion Solitaire的深度加固学习PDF文件第5页

可下载资源数量

已经购买

下载数量：1

Morpion Solitaire的深度加固学习

Morpion Solitaire的深度加固学习

相关文件推荐

深度学习

基于深度学习

深度学习

深度学习

深度学习

无限视野的深度加固学习...

投资组合选择的深度加固学习

自主驾驶的深度加固学习...

车辆路线问题的深度加固学习

深度强化学习

使用深度学习

深度强化学习

专家机器学习：深度学习（M/W/D）

深度学习中的优化

使用深度学习

水力发电的加固学习

量子加固学习

深度学习信号处理

使用深度学习

虚拟环境中音频吸引力的代理的深度加固学习

财务深度学习

使用深度学习

深度学习和人工智能

使用深度学习

与加固学习PA026

使用深度学习

深度强化学习

使用深度学习

机器学习与深度学习

使用深度学习1

XiaoMi-AI