通过部分监督的强化学习___XiaoMi-AI 助力科研平台

通过部分监督的强化学习

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过部分监督的强化学习

¥ 1.0

热度

抽象的深入强化学习表明，在视频游戏，机器人控制，官方驾驶和药物发现等不同领域的跨不同领域取得了巨大的成就。部分可观察的域中的常见方法在很大程度上倾向于从高维观测（例如图像）中端到端学习，而没有明确推理真实状态。我们提出了一个替代方向，引入了部分规定的加固学习（PSRL）框架。PSRL的核心是受监督和无监督学习的融合。该方法利用州估计器从高维观测中提取监督的语义状态信息，这些观察通常在培训时完全可用。这产生了更容易解释的政策，这些政策由控制构成状态预测。并行，捕获了一个无透视的潜在表示。这两个 - 语义状态和潜在状态 - 然后融合并用作策略网络的输入。这种并置为从业者提供了灵活而动态的范围：从强调监督的状态信息到整合富裕的潜在见解。广泛的实验结果表明，通过合并这些双重表示，PSRL提供了有效的平衡，增强了模型，可以在保存的同时使用，并且通常明显胜过表现，这是通过奖励和收敛速度以传统方法设定的性能基准。

添加pdf代下载 VIP点击下载文件

通过部分监督的强化学习

主要关键词

机器人广泛的监督收敛速度潜在状态潜在观察的控制 PSRL 可观察的动态传统方法端到端高维方法输入学习有效的学习的倾向于巨大的状态融合语义规定的监督的估计器部分实验结果动态的观测信息保存的提供

通过部分监督的强化学习PDF文件第1页

通过部分监督的强化学习PDF文件第2页

通过部分监督的强化学习PDF文件第3页

通过部分监督的强化学习PDF文件第4页

通过部分监督的强化学习PDF文件第5页

可下载资源数量

已经购买

下载数量：1

通过部分监督的强化学习

通过部分监督的强化学习

相关文件推荐

将有监督的学习和强化学习与部分标签结合了多标签分类任务

基于强化学习

强化学习：Q学习

强化学习（强化学习）

与安全强化学习

深度强化学习

通过基于模型的强化学习

强化学习：DQN

推进强化学习

深度强化学习

强化学习基盘

基于表示的强化学习

讲座5：无监督的学习

使用强化学习

深度强化学习

强化学习简介

控制理论与强化学习

监督与无监督的学习

深度强化学习

多代理强化学习

密集的深强化学习

基于模型的强化学习

贝叶斯强化学习

使用强化学习

深度学习、强化学习和 Q 学习

在非马克维亚环境中的强化学习

学习如何通过自我调整强化来学习

有弹性的受限强化学习

通过无监督的预读和内在的学习

强化学习：全面的概述

XiaoMi-AI