获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
我们介绍了基于事件的QAVG(EBQAVG)算法,该算法将基于事件的通信集成到联合Q学习中。QAVG由(Jin等人,2022),在局部计算和全局聚集之间交替。每个代理都会在服务器汇总所有N代理的值函数之前执行其值函数的多个本地更新。为了提高沟通效率,连续的聚集之间执行了几个本地更新。遵循相同的本地更新和聚合结构,基于事件的QAVG算法使代理只有在发生重大更改时才可以将Q-table更新传达给中央服务器,从而减少了不必要的通信开销。我们提供了算法及其通信协议的详细描述。
主要关键词