新 Libratus AI 挑战职业扑克玩家

2015 年,在一场艰苦的德州扑克锦标赛中,一些世界顶级玩家与名为 Claudico 的超级计算机驱动的人工智能进行了较量。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

2015 年,在一场艰苦的德州扑克锦标赛中,一些世界顶级玩家与名为 Claudico 的超级计算机驱动的人工智能进行了较量。

从上一系列比赛的结果来看,无论是人类还是人工智能,都无法谈论无条件的优越性。今年的 200,000 美元重赛由四名职业扑克玩家对阵 Libratus AI。比赛将于 1 月 11 日开始在匹兹堡 Rivers Casino 举行。参与创建 Claudico 和 Libratus 的人之一认为,人工智能将能够在未来几年内(甚至更早)击败最好的人类玩家,“我仍然认为这会在未来五年内发生,但有可能。卡内基梅隆大学计算机科学家 Tuomas Sandholm 表示,“这将在未来几年内发生。” “人类有可能赢得这场比赛,但这并不明显。”

游戏AI已经掌握了多个版本的扑克。但无限注德州扑克变体尤其具有挑战性,在游戏的不同阶段有 10,160 种可能的情况(这可能比宇宙中的原子数量还要多)。如此高的难度是因为在这个版本的扑克中,两个玩家可以不受限制地下注。

为了掌握这个游戏,许多人工智能依赖于一种称为反事实后悔最小化(CFR)的算法。通常,CFR 算法尝试在扑克等游戏中在每个决策点分多个步骤进行操作。首先,他们提出了代表游戏不同结果的假设值。其次,他们使用损失最小化方法来查看哪种策略能产生最佳结果。第三,他们通常将最近的策略与所有过去的策略进行平均。