使用分布式错误信号___XiaoMi-AI 助力科研平台

使用分布式错误信号

可下载资源数量

已经购买

下载数量：1

单价	0 2.0
Coupon	100% 0%
Total	0 2.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

使用分布式错误信号

¥ 2.0

热度

基于生物奖励的学习中的一个计算问题是如何在Accumbens（NAC）中执行信用分配以更新突触权重。许多研究表明，NAC多巴胺编码时间差异（TD）错误来学习价值预测。但是，多巴胺是在区域均匀浓度中同步分布的，该浓度不支持明确的信用分配（如背波使用）。尚不清楚单独的分布式错误是否足以使突触进行协调更新以学习复杂的，非线性奖励的学习任务。我们设计了一种新的深Q学习算法（一种人工D opamine）来计算证明，同步分布的每层TD误差可能足以学习令人惊讶的复杂RL任务。我们通过经验评估了我们在漫画，深度控制套件和经典控制任务上的算法，并表明它通常可以实现与使用反向流向的深度RL算法相当的性能。

添加pdf代下载 VIP点击下载文件

使用分布式错误信号

主要关键词

深度 NAC 分布式分配控制任务浓度单独的错误多巴胺复杂的奖励控制 TD 算法相当的反向流非线性任务深度控制足以 RL 突触学习明确的

使用分布式错误信号PDF文件第1页

使用分布式错误信号PDF文件第2页

使用分布式错误信号PDF文件第3页

使用分布式错误信号PDF文件第4页

使用分布式错误信号PDF文件第5页

可下载资源数量

已经购买

下载数量：1

使用分布式错误信号

使用分布式错误信号

相关文件推荐

使用分布式能量BalanceModel

使用2

使用深

使用

使用

使用

使用

使用

使用

使用

使用

使用1

使用

使用多维前聚类

使用

使用零

使用

使用

使用

如何使用这些准则

使用

使用

使用

使用

使用

使用

使用

使用

使用

使用

XiaoMi-AI