策略迭代是双人游戏中常用的一种技术,用于确定获胜者或计算收益,但据我们所知,尚未考虑过策略迭代的通用框架。受之前对简单随机游戏的研究启发,我们提出了一种基于 MV 链的策略迭代的通用形式化方法,用于在合适的完整格类上求解最小不动点方程。我们设计了可用于非扩展不动点函数的算法,这些函数分别表示为所谓的最小和最大分解。相应地,我们开发了两种不同的技术:从上方进行的策略迭代,它必须解决迭代可能达到的不动点不是最小的问题;从下方进行的策略迭代,它在算法上更简单,但需要更复杂的正确性论证。我们将我们的方法应用于解决能量游戏并计算概率自动机的行为指标。