Loading...
机构名称:
¥ 1.0

我们介绍了基于事件的QAVG(EBQAVG)算法,该算法将基于事件的通信集成到联合Q学习中。QAVG由(Jin等人,2022),在局部计算和全局聚集之间交替。每个代理都会在服务器汇总所有N代理的值函数之前执行其值函数的多个本地更新。为了提高沟通效率,连续的聚集之间执行了几个本地更新。遵循相同的本地更新和聚合结构,基于事件的QAVG算法使代理只有在发生重大更改时才可以将Q-table更新传达给中央服务器,从而减少了不必要的通信开销。我们提供了算法及其通信协议的详细描述。

基于事件的联合Q学习

基于事件的联合Q学习PDF文件第1页

基于事件的联合Q学习PDF文件第2页

基于事件的联合Q学习PDF文件第3页

基于事件的联合Q学习PDF文件第4页

基于事件的联合Q学习PDF文件第5页

相关文件推荐

2023 年
¥3.0
2023 年
¥1.0
2021 年
¥1.0
2017 年
¥5.0
2024 年
¥2.0
1900 年
¥6.0
2025 年
¥1.0
2023 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0
2022 年
¥4.0
2021 年
¥5.0
2025 年
¥2.0
2024 年
¥7.0
2024 年
¥1.0
2007 年
¥1.0
2023 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0