基于事件的联合Q学习
机构名称:
¥ 1.0

我们介绍了基于事件的QAVG(EBQAVG)算法,该算法将基于事件的通信集成到联合Q学习中。QAVG由(Jin等人,2022),在局部计算和全局聚集之间交替。每个代理都会在服务器汇总所有N代理的值函数之前执行其值函数的多个本地更新。为了提高沟通效率,连续的聚集之间执行了几个本地更新。遵循相同的本地更新和聚合结构,基于事件的QAVG算法使代理只有在发生重大更改时才可以将Q-table更新传达给中央服务器,从而减少了不必要的通信开销。我们提供了算法及其通信协议的详细描述。

基于事件的联合Q学习

基于事件的联合Q学习PDF文件第1页

基于事件的联合Q学习PDF文件第2页

基于事件的联合Q学习PDF文件第3页

基于事件的联合Q学习PDF文件第4页

基于事件的联合Q学习PDF文件第5页

相关文件推荐

点亮学习脑
2023 年
¥3.0
我们如何学习
2023 年
¥1.0
学习如何学习
2021 年
¥1.0
学习如何学习
2017 年
¥5.0
学习多
2024 年
¥2.0
学习什么?
1900 年
¥6.0
学习
2025 年
¥1.0
学习吃
2023 年
¥1.0
向专家学习
2025 年
¥1.0
开始学习
2024 年
¥1.0
学习
2022 年
¥4.0
增强学习
2021 年
¥5.0
增强学习
2025 年
¥2.0
学习计划
2024 年
¥7.0
碳中性事件
2024 年
¥1.0
com}ng事件
2007 年
¥1.0
净零碳事件
2023 年
¥1.0
虚拟学习
2024 年
¥1.0
AI学习大师班
2024 年
¥1.0
每月事件
2025 年
¥1.0
学习指南
2024 年
¥1.0