Loading...
机构名称:
¥ 1.0

摘要 — 本文介绍了使用基于强化学习 (RL) 的模型预测控制 (MPC) 来寻找多智能体电池存储系统的最佳策略。考虑了电价的时变预测和生产需求不确定性。我们专注于优化经济目标成本,同时避免充电状态过低或过高,因为这可能会损坏电池。我们考虑了主电网提供的有界功率以及每个智能体的功率输入和状态的约束。参数化的 MPC 方案用作确定性策略梯度方法的函数近似器,RL 通过更新参数来优化闭环性能。仿真结果表明,所提出的方法能够解决约束并提供最佳策略。

使用 MPC 进行多代理电池存储管理 - ...

使用 MPC 进行多代理电池存储管理 - ...PDF文件第1页

使用 MPC 进行多代理电池存储管理 - ...PDF文件第2页

使用 MPC 进行多代理电池存储管理 - ...PDF文件第3页

使用 MPC 进行多代理电池存储管理 - ...PDF文件第4页

使用 MPC 进行多代理电池存储管理 - ...PDF文件第5页

相关文件推荐