点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
通常,马尔可夫决策过程是“一个离散的随机控制过程。它提供了一个数学框架,用于在结果部分是随机的,部分地在决策者控制的情况下对决策进行建模。MDP是有用的研究通过动态编程解决的优化问题。”(Wikipedia)
主要关键词