Loading...
机构名称:
¥ 2.0

我们提出了一种通用策略改进算法(GSIA),以发现简单随机游戏(SSG)的最佳策略。我们证明了GSIA的正确性,并得出了一般的复杂性结合,这意味着并改善了几篇文章的结果。首先,我们删除了SSG停止的假设,这通常是通过对游戏的多项式爆炸而获得的。第二,我们证明了与策略相关的值的分母的紧密绑定,并使用它来证明所有策略改进算法实际上是可以在随机顶点的数字r中处理的固定参数。所有已知的策略改进算法都可以看作是GSIA的实例,它允许Condon [13]从下面分析收敛的复杂性,并提出了一类算法,将Gimbert和Horn的算法推广[15,16]。这些算法最多终止R!迭代,对于二进制SSG,它们的迭代次数少于Ibsen-Jensen和Miltersen [17]给出的当前最佳确定性算法。

简单随机游戏的通用策略改进方法

简单随机游戏的通用策略改进方法PDF文件第1页

简单随机游戏的通用策略改进方法PDF文件第2页

简单随机游戏的通用策略改进方法PDF文件第3页

简单随机游戏的通用策略改进方法PDF文件第4页

简单随机游戏的通用策略改进方法PDF文件第5页