策略函数

File

2023-08-07 机构名称:

深度学习解决经济模型

• 存在一个决策规则（又称策略函数），可以根据当前的状态给出明天的消费和资本的最佳选择：

查看详细

File

2021-08-03 机构名称:

Monte Carlo Tree Search（MCTS）是一种随机计划算法，可以为两人游戏中的动作提供建议，而无需启发式启发式。在这项工作中，我们描述了一种量子算法，以加快在执行多个此类推出的MCT变体中执行的随机“随机推出”步骤。引入了另一种量子算法，该算法加快了MCTS实例集合的计算。作为开发的技术的推论，提出了一种量子算法，用于估算任意（随机）长度的保单引导在任意（随机）环境中的期望值或最大化的第一步。此步行是由初始状态，策略函数和过渡功能定义的，其值通过在所采用的完整路径上定义的任意评估功能分配给了这样的walk。相对于最著名的经典算法，发现的所有加速度都是二次的。

查看详细

File

2024-07-29 机构名称:

论文建议近似函数分析...

在对电动驱动器的最佳控制中，人们可以通过在退缩地平线上求解基础控制问题，在离散时间步骤中隐式优化控制输入，或者可以尝试明确地找到一个直接映射测得的测量状态以控制操作的控制策略函数。后一种方法通常称为显式最佳控制，需要使用近似功能来解决连续（即无限）状态和动作空间。一旦找到了（近似）最佳控制策略，通常比在每个控制器周期必须在线优化过程进行在线优化过程的隐式情况要快得多。由于控制器决策时间间隔在电动驱动器的子毫秒范围内，因此明确的最佳控制的快速在线推断是一项令人信服的功能。在这里，潜在的控制策略近似函数涵盖了广泛的函数类别，例如神经网络，高斯过程或拉瓜多项式[1]。可以从数据（例如增强学习[2]）或基于可用植物模型（差异预测性控制[3]）中学习控制策略。在这两种情况下，近似函数的拓扑都在控制策略的性能以及训练和推理阶段的数值复杂性方面都起着至关重要的规则。虽然近似函数的特定选择通常是基于临时启发式方法，但如何系统地选择给定控制任务的最佳近似函数的问题仍然在很大程度上开放。

查看详细

XiaoMi-AI文件搜索系统

策略函数

深度学习解决经济模型

蒙特卡洛树搜索的量子加速

论文建议近似函数分析...

按机构统计排名前十媒体

按照发布年份统计数据

XiaoMi-AI