随着基于逆变器的可再生能源的渗透,深厚的增强学习(DRL)被认为是实现实时和自主控制的最有前途的解决方案之一,以实现未来的碳中性动力系统。尤其是对基于DRL的频率控制方法进行了广泛的研究,以克服基于模型的方法的局限性,例如大型系统的计算成本和可扩展性。尽管如此,基于DRL的频率控制方法的现实实施面临以下乐趣的挑战:1)在学习和决策过程中的安全保证; 2)针对动态系统操作条件的适应性。到此为止,这是提出适应性和安全认证的DRL(ADAPSAFE)算法的第一份用于频率控制的算法,以模拟上述挑战。在特殊的情况下,一种新型的自我调整控制屏障功能旨在积极补偿各种安全性限制下不安全的频率控制策略,从而实现了瓜兰安全性。此外,元提高学习的概念旨在显着增强其在非平稳电源系统环境中的适应性,而无需牺牲安全成本。实验是根据GB 2030功率系统进行的,结果表明,所提出的Adapsafe在训练和测试阶段的保证安全性方面表现出卓越的性能,以及其对系统参数动力学变化的相当适应性。
主要关键词