我们提出了一种通用策略改进算法 (GSIA) 来寻找简单随机博弈 (SSG) 的最优策略。我们证明了 GSIA 的正确性,并推导出一个一般复杂度界限,它暗示并改进了几篇文章的结果。首先,我们删除了 SSG 停止的假设,这通常是通过博弈的多项式爆炸获得。其次,我们证明了与策略相关的值的分母的严格界限,并使用它来证明所有策略改进算法实际上都是随机顶点数量 r 的固定参数可处理的。所有已知的策略改进算法都可以看作是 GSIA 的实例,这允许分析 Condon [ 14 ] 从下方收敛的复杂性,并提出一类推广 Gimbert 和 Horn 算法的算法 [ 16 , 17 ]。这些算法最多在 r 中终止!迭代次数,对于二进制 SSG,它们的迭代次数比 Ibsen-Jensen 和 Miltersen [18] 给出的当前最佳确定性算法要少。
我们提出了一种通用策略改进算法(GSIA),以发现简单随机游戏(SSG)的最佳策略。我们证明了GSIA的正确性,并得出了一般的复杂性结合,这意味着并改善了几篇文章的结果。首先,我们删除了SSG停止的假设,这通常是通过对游戏的多项式爆炸而获得的。第二,我们证明了与策略相关的值的分母的紧密绑定,并使用它来证明所有策略改进算法实际上是可以在随机顶点的数字r中处理的固定参数。所有已知的策略改进算法都可以看作是GSIA的实例,它允许Condon [13]从下面分析收敛的复杂性,并提出了一类算法,将Gimbert和Horn的算法推广[15,16]。这些算法最多终止R!迭代,对于二进制SSG,它们的迭代次数少于Ibsen-Jensen和Miltersen [17]给出的当前最佳确定性算法。
1 与之前的报告一致,本报告中的“可持续投资”是指广泛而包容的投资方法定义,包括在本报告中列出的七种可持续或负责任投资策略的投资组合选择和管理中考虑环境、社会和治理因素。GSIA 使用这一包容性定义,认识到其含义和用法存在区别和地区差异,以及相关或可互换的术语,如负责任投资和社会责任投资。2 欧盟可持续金融披露条例 (SFDR) 中的一些定义可能有不同的解释,预计会有额外的监管指导。因此,使用的数据开始与新设置保持一致。
1 与之前的报告一致,本报告中的“可持续投资”是指广泛而包容的投资方法定义,包括在本报告中列出的七种可持续或负责任投资策略中,在投资组合选择和管理中考虑环境、社会和治理因素。GSIA 使用这一包容性定义,认识到其含义和用法存在差异和地区差异,以及相关或可互换的术语,如负责任投资和社会责任投资。 2 欧盟可持续金融披露条例 (SFDR) 中的一些定义可能有不同的解释,预计会有额外的监管指导。因此,所使用的数据开始与新设置保持一致。