Loading...
机构名称:
¥ 6.0

▶确定性世界中:计划 - 从启用到目标的行动顺序。▶MDP,我们需要一个策略π:s→a。▶每个可能状态的动作。为什么?▶最佳政策是什么?

不确定性下的顺序决策马尔可夫决策过程(MDP)

不确定性下的顺序决策马尔可夫决策过程(MDP)PDF文件第1页

不确定性下的顺序决策马尔可夫决策过程(MDP)PDF文件第2页

不确定性下的顺序决策马尔可夫决策过程(MDP)PDF文件第3页

不确定性下的顺序决策马尔可夫决策过程(MDP)PDF文件第4页

不确定性下的顺序决策马尔可夫决策过程(MDP)PDF文件第5页

相关文件推荐

2023 年
¥15.0