获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要 - 本文提出了开发非线性模型预测控制(NMPC)策略的端到端学习,该策略不需要明确的第一原理模型,并假定系统动力学是未知或部分已知的。本文提出了使用可用的测量结果来识别标称复发性神经网络(RNN)模型来捕获非线性动态,其中包括对状态变量和输入的约束。要解决仅将模型拟合到数据而产生的次优控制策略的问题,本文使用加固学习(RL)来调整NMPC方案并为真实系统生成最佳策略。该方法的新颖性在于使用RL来克服名义RNN模型的局限性并产生更准确的控制策略。本文讨论了RNN模型的初始状态估计的实施方面以及MPC中神经模型的整合。在经典的基准控制问题上证明了所提出的方法:级联的两个坦克系统(CTS)。索引术语 - 强化学习,非线性模型预测控制,复发性神经网络