Loading...
机构名称:
¥ 3.0

本文的目的是研究未知系统所谓的间接和直接数据驱动控制背后的基本机制。特别是,我们考虑应用于线性二次调节器问题的策略迭代。考虑了两个迭代过程,其中考虑了从系统中收集的数据来计算所需的最佳控制器的新估计。在间接策略迭代中,数据用于通过递归标识方案获得更新的模型估计,该方案以确定的方式使用,以执行经典的策略迭代更新。通过将并发模型识别和控制设计作为两个算法系统之间的反馈互连,我们提供了一个闭环分析,该分析显示了数据中任意激发的收敛性和稳健性。在直接策略迭代中,数据用于近似值函数并设计关联的控制器,而无需中间标识步骤。在提出了克服潜在的身份能力问题的最近提议的方案的扩展后,我们确定了在哪些条件下保证该程序提供最佳控制器。基于这些分析,我们能够比较两种方法的优势和局限性,突出了所需的样本,收敛属性和激发要求等方面。模拟以说明结果。

识别在数据驱动的策略迭代中的作用:...

识别在数据驱动的策略迭代中的作用:...PDF文件第1页

识别在数据驱动的策略迭代中的作用:...PDF文件第2页

识别在数据驱动的策略迭代中的作用:...PDF文件第3页

识别在数据驱动的策略迭代中的作用:...PDF文件第4页

识别在数据驱动的策略迭代中的作用:...PDF文件第5页

相关文件推荐