摘要 - 间歇性更新能源资源的大规模整合引入了对电力系统供应方面的不确定性和波动性的增加,从而弥补了系统的操作和控制。最近,数据驱动的AP-PARACHES,尤其是加强学习(RL)在解决电力系统中的复杂控制挑战方面表现出了巨大的希望,因为RL可以从交互式反馈中学习而无需对系统模型的先验知识。然而,无模型RL方法的训练过程在很大程度上依赖于探索的随机决策,这可能会导致“不良”决策,违反了关键的安全限制并导致灾难性的控制结果。由于RL方法无法理论上确保电力系统中的决策安全,因此直接在现实世界中部署传统的RL算法是无法接受的。因此,近年来RL应用中的安全问题(称为安全RL)引起了广泛关注,导致了许多重要的发展。本文对最先进的安全RL技术进行了全面审查,并讨论了如何将这些技术应用于电力系统控制问题,例如频率调节,电压控制和能量管理。然后,我们就关键挑战和未来的研究方向提出了与融合和最佳,培训效率,普遍性和现实世界部署有关的讨论。
主要关键词