基于分布式强化学习的不平衡解决机制中的能源套利策略
机构名称:
¥ 1.0

可再生能源渗透率的增长使供应变得更加不确定,并导致系统不平衡加剧。这种趋势与单一不平衡定价相结合,为平衡责任方 (BRP) 在不平衡解决机制中进行能源套利提供了机会。为此,我们提出了一种基于分布式强化学习的电池控制框架。我们提出的控制框架采取了风险敏感的视角,允许 BRP 调整其风险偏好:我们的目标是优化套利利润和风险度量(本研究中的风险价值)的加权和,同时限制电池的每日循环次数。我们使用 2022 年比利时的不平衡价格评估我们提出的控制框架的性能,并比较两种最先进的 RL 方法,即深度 Q 学习和软演员-评论家 (SAC)。结果表明,分布式软演员-评论家方法优于其他方法。此外,我们注意到,只有当代理对价格更确定时,我们的完全规避风险的代理才会适当地学会通过对电池进行(放电)充电来对冲与未知不平衡价格相关的风险。

基于分布式强化学习的不平衡解决机制中的能源套利策略

基于分布式强化学习的不平衡解决机制中的能源套利策略PDF文件第1页

基于分布式强化学习的不平衡解决机制中的能源套利策略PDF文件第2页

基于分布式强化学习的不平衡解决机制中的能源套利策略PDF文件第3页

基于分布式强化学习的不平衡解决机制中的能源套利策略PDF文件第4页

基于分布式强化学习的不平衡解决机制中的能源套利策略PDF文件第5页