在连续动作，状态和时间___XiaoMi-AI 助力科研平台

在连续动作，状态和时间

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

在连续动作，状态和时间

¥ 1.0

热度

经典的价值迭代方法并非应用于具有连续状态和动作的环境。对于此类环境，状态和动作通常被离散化，从而导致计算复杂性的指数增加。在本文中，我们提出了连续拟合的价值迭代（CFVI）。该算法可以通过已知的动力学模型为连续状态和动作提供动态编程。利用连续时间公式，可以为非线性控制 - 官能动态提供最佳策略。此封闭形式解决方案可以使价值迭代的有效扩展到连续的环境。我们在非线性控制实验中表明，动态编程解决方案获得了与模拟中深层执行学习方法相同的定量性能，但是当转移到物理系统中时会进行。CFVI获得的策略对于动态的变化更为强大，尽管仅使用确定模型，并且没有明确将鲁棒性纳入优化。物理系统的视频可在https：//网站上获得。google.com/view/value-iteration。

添加pdf代下载 VIP点击下载文件

在连续动作，状态和时间

主要关键词

CFVI 非线性相同的动态的学习方法环境系统的经典的迭代的物理系统状态连续状态连续动作的连续的动作鲁棒性迭代已知的力学模型线性控制系统编程价值方法动力学控制实验复杂性获得离散化物理动态解决方案

在连续动作，状态和时间PDF文件第1页

在连续动作，状态和时间PDF文件第2页

在连续动作，状态和时间PDF文件第3页

在连续动作，状态和时间PDF文件第4页

在连续动作，状态和时间PDF文件第5页

可下载资源数量

已经购买

下载数量：1

在连续动作，状态和时间

在连续动作，状态和时间

相关文件推荐

山时间

同时间隔数 - 滴

动作图

硅状态：

时间

个别状态

光子时间模式的远程投射状态

光子时间晶体中的连续变量簇状态

太阳状态

密西西比州状态

怀俄明州的状态

在有限时间

怀俄明州的状态

海峡时间

海峡时间

泽西州的状态

华盛顿状态

新泽西州的状态

新泽西州的状态

状态报告

新泽西州的状态

心脏状态

新泽西州的状态

物质的三个状态

我的时间，我们的地方

佛蒙特州的状态

技能状态

国家状态2024

俄克拉荷马州的状态

佛蒙特州的状态

XiaoMi-AI