点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要 — 本文介绍了使用基于强化学习 (RL) 的模型预测控制 (MPC) 来寻找多智能体电池存储系统的最佳策略。考虑了电价的时变预测和生产需求不确定性。我们专注于优化经济目标成本,同时避免充电状态过低或过高,因为这可能会损坏电池。我们考虑了主电网提供的有界功率以及每个智能体的功率输入和状态的约束。参数化的 MPC 方案用作确定性策略梯度方法的函数近似器,RL 通过更新参数来优化闭环性能。仿真结果表明,所提出的方法能够解决约束并提供最佳策略。
主要关键词