摘要 - 这封信研究了基于网格形成的安全强化学习策略(GFM)基于逆变器的频率调节。确保在学识渊博的控制策略下基于逆变器的资源(IBR)系统的稳定性,将基于模型的加固学习(MBRL)技术与Lyapunov方法相结合,该方法决定了国家和行动的安全区域。为了获得接近最佳的控制策略,使用从吸引力区域(ROA)采样的数据,可以通过近似动态编程(ADP)安全地改善控制性能。此外,为了增强对逆变器中参数不确定性的控制鲁棒性,提议的MBRL采用了高斯过程(GP)模型,以从测量中有效地学习系统动力学。数值模拟验证了所提出的方法的有效性。
主要关键词