MuZero 在不了解规则的情况下掌握围棋、国际象棋、将棋和 Atari 游戏

DeepMind 旨在证明 AI 不仅可以精通某种游戏,而且甚至可以在不了解规则的情况下擅长该游戏。名为 MuZero 的新型 AI 代理不仅可以处理围棋、国际象棋和将棋等视觉上简单的策略游戏,还可以处理 Atari 的视觉上复杂的游戏。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

DeepMind 旨在证明 AI 不仅可以精通某种游戏,而且甚至可以在不了解规则的情况下擅长该游戏。名为 MuZero 的新型 AI 代理不仅可以处理围棋、国际象棋和将棋等视觉上简单的策略游戏,还可以处理 Atari 的视觉上复杂的游戏。

击败围棋世界冠军的人工智能 AlphaGo,了解规则并牢记规则,研究人与人之间的博弈并形成一套最佳实践和策略。 AlphaGo Zero 的下一个版本在没有人工输入的情况下做到了这一点,只与自己对战。 AlphaZero 在 2018 年对国际象棋和将棋做了同样的事情,创建了一个可以熟练玩所有这些游戏的人工智能模型。

击败世界冠军

但在所有这些情况下,人工智能都面临着一组不可变的、已知的游戏规则,创建了一个可以围绕其构建策略的框架。如果你被告知棋子可以成为皇后,你会从一开始就计划好,但如果你必须自己找出答案,你可能会制定完全不同的策略。

正如 DeepMind 在其新研究中解释的那样,提前告知人工智能规则“使得它们很难应用于通常很复杂且难以简化为简单规则的混乱的现实世界问题。”

因此,该公司的最新成果是 MuZero,它不仅可以玩上述游戏,还可以玩许多 Atari 游戏,而且不需要了解规则手册。最新的模型不仅通过实验学会了玩所有这些游戏,而且甚至没有指定最基本的规则。

了解游戏世界可以让 MuZero 有效地规划其行动,即使游戏世界与许多 Atari 游戏一样是部分随机的且视觉上复杂的。这让他更接近人工智能,人工智能将能够安全、智能地与现实世界互动,学习理解周围的世界。