反事实遗憾最小化(CFR)是一种用于寻找不完美信息游戏的NASH平衡策略的算法系列。CFR已被用来达到许多基准游戏中的里程碑,例如Texas Hold'Em [2]和Texas No-Limit Texas Hold'Em [3]。值得注意的是,这些算法使用了CFR的表格形式,其中将策略保存在表格中,以解决代理可以找到自己的所有可能情况。在建模现实世界游戏时,该表可能会变得过多。为了压缩模型,信息摘要用于将不同的情况列入混合在一起。这些抽象的问题是它们通常需要广泛的域知识,而抽象游戏中的平衡可能无法准确反映整个游戏的均衡[4]。
主要关键词