我们提出了一种加固学习策略,以通过主动更改转子速度,转子偏航角和叶片螺距角来控制风力涡轮机能量。具有优先体验重放剂的双重Q学习与刀片元件动量模型相结合,并经过训练以允许控制风。训练代理商可以决定最佳的控制(速度,偏航,音高),以实现简单的稳定风,随后通过真正的动态湍流挑战,表现出良好的性能。将双重Q学习与经典价值的迭代增强学习控制进行了比较,并且两种策略在所有环境中都超过了经典的PID控制,增强型学习方法非常适合不断变化的环境,包括湍流/阵阵风,显示出极大的适应性。最后,我们将所有控制策略与实际风进行比较,并计算年度能源生产。在这种情况下,双重Q学习算法也胜过经典方法。
主要关键词