增强学习（MIE1630）___XiaoMi-AI 助力科研平台

增强学习（MIE1630）

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

增强学习（MIE1630）

¥ 1.0

热度

课程描述：本课程是为增强学习提供基本概念和数学框架。具体主题包括马尔可夫决策过程，表格加强学习，策略梯度方法和功能近似，例如深度强化学习。可选主题是分配加强学习，基于模型的方法，外线学习，逆强化学习和多代理强化学习。该课程旨在使研究学生从方法论发展或强化学习对应用程序的应用的角度来体验有关强化学习的研究。教科书：无教科书参考：强化学习：第二版，R。Sutton和A. Barto，麻省理工学院出版社，2018年马尔可夫决策过程 - 离散的随机动态编程，Martin L. Puterman，Wiley，Wiley，1994 cglee@mie.utoronto.ca ta：将宣布主题列表：

添加pdf代下载 VIP点击下载文件

增强学习（MIE1630）

主要关键词

主题应用程序模型的学习的 Sutton 决策教科书梯度 Wiley Barto 研究方法论应用的动态离散的强化课程基本概念过程加强马尔可夫学习

增强学习（MIE1630）PDF文件第1页

增强学习（MIE1630）PDF文件第2页

可下载资源数量

已经购买

下载数量：1

增强学习（MIE1630）

增强学习（MIE1630）

相关文件推荐

增强学习

增强学习

增强学习

通过增强学习

增强学习

增强学习

增强学习

二元增强学习

通过增强学习

增强学习

逆增强学习

逆增强算法学习

增强学习是您需要的

微调中的增强学习价值

了解逆增强学习

suppodular增强学习

学习为增强学习优化

控制系统和增强学习

增强学习（E061360）

增强学习是您需要的

基于评级的增强学习

无模型增强学习

通过微小的增强学习

离线增强学习

增强学习中的评估

进化增强学习

技术增强学习

有效的逆增强学习而不复合错误

增强解剖学学习中的现实

模型预测控制和增强学习

XiaoMi-AI