使用深钢筋学习的非线性最佳控制
机构名称:
¥ 1.0

摘要,我们根据深钢筋学习的应用(DRL)提出了范式控制流体流体的转变。此策略正在迅速在机器学习社区中传播,并且以与非线性控制理论的联系而闻名。DRL的起源可以追溯到最佳控制对非线性问题的概括,在连续公式中引导到Hamilton-Jacobi-Bellman(HJB)方程,DRL旨在提供离散的,数据驱动的近似值。DRL中唯一的先验要求是定义瞬时奖励,以衡量系统处于给定状态时动作的相关性。然后将值函数定义为预期的累积奖励,这是最大化的目标。通过神经网络近似控制动作和值函数。在这项工作中,我们通过参数分析在一维[4]中控制了DRL和重新发现我们最近控制Kuramoto-Sivashinsky(KS)方程的结果。

使用深钢筋学习的非线性最佳控制

使用深钢筋学习的非线性最佳控制PDF文件第1页

使用深钢筋学习的非线性最佳控制PDF文件第2页

使用深钢筋学习的非线性最佳控制PDF文件第3页

使用深钢筋学习的非线性最佳控制PDF文件第4页

使用深钢筋学习的非线性最佳控制PDF文件第5页

相关文件推荐

使用最佳控件
2023 年
¥1.0
使用深钢筋学习
2023 年
¥1.0
使用LWE加密控制
2025 年
¥1.0
使用深钢筋学习
2024 年
¥1.0
使用集中式控制
2023 年
¥2.0
使用手势控制窗口
2024 年
¥1.0
使用IoT和语音控制
2025 年
¥1.0