Google 的 AlphaProof 可以用于曾经被认为超越机器的数学证明

Google 的 AlphaProof 能够解决复杂的数学问题,但它最大的功能实际上可能是发现错误。

来源:ZME科学
AI 生成的图像。

2024 年,人工智能进入了国际数学奥林匹克 (IMO) 的竞争。谷歌的 AlphaProof 属于同一个 Alpha 小组,该小组也创建了 AlphaFold 和 AlphaGo。它解决了以前被认为是人类独有的创造力和抽象推理水平所需的问题。

阿尔法 创建了 AlphaFold AlphaGo

现在,在《自然》杂志上发表的一篇具有里程碑意义的论文中,研究人员详细介绍了这一成就背后的技术。

研究人员详细介绍了该技术

如何教机器思考

在过去的二十年里,计算机在完美信息游戏中逐渐击败了人类冠军。它掌握了跳棋,然后是国际象棋(深蓝),最后是极其复杂的围棋游戏(AlphaGo)。但数学完全是另一头野兽。这不是一个你拥有所有信息的单一游戏。它更像是一个无限的游戏宇宙,只要你遵守一些规则,你就可以做任何事情。

围棋游戏 但数学是一头不同的野兽

解决复杂的数学问题很少涉及暴力或密集计算。它更多的是构建一个严格且合乎逻辑的论证。您经常需要找到一个(或多个)巧妙的技巧来解决问题。 AlphaProof 接受过培训,可以使用现代数学家使用的相同专业工具:“证明助手”。将证明助手(在本例中称为 Lean)视为文字处理器、逻辑规则手册和绝对正确的裁判的组合。

一种称为精益
AlphaProof 在 2024 年 IMO 问题上取得了非凡的成就。图片来源:DeepMind。

训练分三个阶段进行:

  • 预训练:首先,模型被输入大量代码和数学文本(3000 亿个代币)来学习逻辑、编程和数学的基本语言。
  • 微调:接下来,它从 Lean 庞大的“Mathlib”库中获得了 300,000 个人类编写的证明示例。这教会了它精益“游戏”的具体规则和常见策略。
  • ‘Mathlib’ 库 强化学习

    人工智能强强联手