持续强化学习___XiaoMi-AI 助力科研平台

持续强化学习

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

持续强化学习

¥ 1.0

热度

尽管近年来对持续学习（CL）的兴趣日益增强，但继续加强学习（CRL）仍然是一项艰巨的任务，因为深层神经网络必须从维持旧任务表现的新任务中从每个从未见过的新任务中推断出适当的行动。为了解决此问题，一些CRL算法使用基于正则化的方法来限制常规CL中使用的权重和基于重播的方法。但是，它需要花费大量时间来学习，因为它需要大量的基于重播和具有复杂正则化项的内存。在本文中，我们提出了一个简单的框架，用于保留相关顺序任务之间的知识fmal，即MAP注意力丢失。我们的方法利用模型的一般CNN，可以很好地执行所有顺序任务，并且注意机制用于提取基本特征进行传输。另外，FMAL同时使用正规化方法和基于重播的方法，例如现有的CRL方法。但是，学习所需的记忆量要小得多，正则化的项相对简单。我们使用最先进的算法评估FMAL。实验结果表明，我们的方法以较高的奖励超过这些基准。

添加pdf代下载 VIP点击下载文件

持续强化学习

主要关键词

CL 模型的神经网络顺序注意力适当的用于简单的大量的仍然是先进的算法 FMAL 使用重播需要任务使用的持续学习实验结果正则基本特征所需的 CRL 方法现有的学习正规化

持续强化学习PDF文件第1页

持续强化学习PDF文件第2页

持续强化学习PDF文件第3页

持续强化学习PDF文件第4页

持续强化学习PDF文件第5页

可下载资源数量

已经购买

下载数量：1

持续强化学习

持续强化学习

相关文件推荐

基于强化学习

强化学习：Q学习

强化学习（强化学习）

深度强化学习

深度强化学习

通过基于模型的强化学习

强化学习：调查

与安全强化学习

深度强化学习

通过基于模型的强化学习

强化学习：DQN

推进强化学习

深度强化学习

强化学习基盘

基于表示的强化学习

使用强化学习

深度强化学习

强化学习简介

控制理论与强化学习

深度强化学习

多代理强化学习

密集的深强化学习

基于模型的强化学习

贝叶斯强化学习

使用强化学习

深度学习、强化学习和 Q 学习

强化学习中的公平性：调查

基于价值进化的强化学习-Github

钢：奇异性感知强化学习

定量交易的强化学习

XiaoMi-AI