点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
2 为什么函数 qi 、 ui 、 p 只依赖于当前状态和动作概况 ( st , ( a ( i ) t ) i ) ,而不依赖于完整历史 ( s 1 , ( a ( i ) 1 ) i , s 2 , ..., st , ( a ( i ) t ) i )?通过概率论中的经典构造(Kolmogorov 和 Rota),我们可以变换状态空间,使得变换后的游戏具有仅依赖于当前状态的函数 qi 、 ui 、 p 。
主要关键词