图形摘要___XiaoMi-AI 助力科研平台

图形摘要

可下载资源数量

已经购买

下载数量：1

单价	0 4.0
Coupon	100% 0%
Total	0 4.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

图形摘要

¥ 4.0

热度

安全加强学习（SRL）旨在优化最大程度地提高长期奖励的控制政策，同时遵守安全限制。SRL具有许多现实世界的应用，例如自动驾驶汽车，工业机器人技术和医疗保健。离线增强学习（RL）的最新进展 - 代理商在不与环境互动的情况下从静态数据集中学习政策 - 已成为一种有希望的方法来得出安全控制策略。但是，离线RL面临着重大挑战，例如数据中的协变量转移和离群值，这可能导致次优政策。同样，在线SRL通过实时环境互动得出安全的政策，与异常值进行斗争，并且通常依靠不切实际的规律性假设，从而限制了其实用性。本文通过提出一种混合访问线路方法来解决这些挑战。首先，离线学习指南在线探索的先验知识。然后，在在线学习过程中，我们用Student-T的流程（TP）替换流行的高斯流程（GP），以增强协变速器和异常值的鲁棒性。

添加pdf代下载 VIP点击下载文件

图形摘要

主要关键词

安全控制机器人流行的挑战学习过程互动数据集安全的静态数据驾驶 SRL 在线规律性 RL 世界的方法安全政策学习流程希望的代理商探索的实用性实际的互动的变速器医疗保健得出离线例如限制实时环境控制策略鲁棒性提高

图形摘要PDF文件第1页

图形摘要PDF文件第2页

图形摘要PDF文件第3页

图形摘要PDF文件第4页

图形摘要PDF文件第5页

可下载资源数量

已经购买

下载数量：1

图形摘要

图形摘要

相关文件推荐

图形摘要

图形摘要

图形摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

表 1.结果摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

摘要

XiaoMi-AI