摘要:本文研究了智能社区中需求端能量管理系统(EMS)的当地策略驱动的多代理深层确定性政策梯度(LSD-MADDPG)方法。LSD-MADDPG通过限制集中式培训期间的数据共享来修改常规MADDPG框架以仅离散的战略信息。在执行过程中,它仅依靠本地信息,消除了培训后数据交换。这种方法解决了EMS解决方案通常面临的关键挑战,这些解决方案为动态,不断增加的社区(例如沟通延迟,单点失败,可伸缩性和非机构环境)提供了。通过利用和共享代理商之间的战略信息,LSD-MADDPG优化了决策 - 同时提高培训效率并保护数据隐私,这是社区EMS的关键问题。拟议的LSD-MADDPG已被证明能够通过协调多个建筑物的室内温度控制和电动汽车充电时间表来降低能源成本并使社区需求曲线变平。比较案例研究表明,LSD-MADDPG通过确保各个建筑物的能源管理行动和社区范围的目标之间的公平对齐,在合作和竞争环境中都表现出色,从而突出了其提高未来智能社区能源管理的潜力。
主要关键词