详细内容或原文请订阅后点击阅览
掌握 Stratego,经典的不完美信息游戏
游戏人工智能 (AI) 系统已发展到一个新的领域。
来源:DeepMind - 新闻与博客研究
掌握 Stratego,经典的不完全信息游戏
- 已发布 2022 年 12 月 1 日作者 Julien Perolat、Bart De Vylder、Daniel Hennes、Eugene Tarassov、Florian Strub 和 Karl Tuyls
Julien Perolat、Bart De Vylder、Daniel Hennes、Eugene Tarassov、Florian Strub 和 Karl Tuyls
DeepNash 通过结合博弈论和无模型深度强化学习从头开始学习玩 Stratego
游戏人工智能 (AI) 系统已进入新领域。经典棋盘游戏 Stratego 比国际象棋和围棋更复杂,比扑克更狡猾,现已被掌握。我们在《科学》杂志上发表了 DeepNash,这是一个通过与自己对战从零开始学习游戏到人类专家水平的人工智能代理。
发表于《科学》 DeepNashDeepNash 使用一种基于博弈论和无模型深度强化学习的新颖方法。它的游戏风格收敛到纳什均衡,这意味着对手很难利用它的玩法。事实上,DeepNash 的难度如此之大,以至于在全球最大的在线 Stratego 平台 Gravon 上,人类专家中 DeepNash 的排名达到了历史前三名。
棋盘游戏历来是衡量人工智能领域进步的标准,它使我们能够研究人类和机器如何在受控环境中制定和执行策略。与国际象棋和围棋不同,Stratego 是一种不完全信息游戏:玩家无法直接观察对手棋子的身份。
这种复杂性意味着其他基于 AI 的 Stratego 系统难以超越业余水平。 这也意味着一种非常成功的 AI 技术“博弈树搜索”,以前用于掌握许多完全信息游戏,但对于 Stratego 来说不够可扩展。 因此,DeepNash 远远超出了博弈树搜索。
了解 Stratego
左: 中: 右: AlphaZero寻求均衡
“