无模型增强学习___XiaoMi-AI 助力科研平台

无模型增强学习

可下载资源数量

已经购买

下载数量：1

单价	0 5.0
Coupon	100% 0%
Total	0 5.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

Loading...

机构名称：

无模型增强学习

¥ 5.0

热度

⇒允许看到所有未来的奖励•不需要模型/MDP过渡或奖励的确切分布•不涉及未来的估计（不进行引导程序）•估计未来奖励的经验奖励的预期奖励，遵循策略π•但是：只能应用于情节问题（情节都必须终止以完成）

添加pdf代下载 VIP点击下载文件

无模型增强学习

主要关键词

未来的过渡估计情节模型经验未来确切应用引导问题奖励终止引导程序只能预期 MDP

无模型增强学习PDF文件第1页

无模型增强学习PDF文件第2页

无模型增强学习PDF文件第3页

无模型增强学习PDF文件第4页

无模型增强学习PDF文件第5页

相关文件推荐