数学家推出 First Proof，这是首个针对人工智能的数学考试 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

数学家推出 First Proof，这是首个针对人工智能的数学考试

2026年2月9日 17:09 33 Comments

对人工智能行业声称在不提供透明度的情况下证明数学结果的说法感到沮丧，一个领先的学者团队提出了一种更好的方法

来源:科学美国人

2026 年 2 月 9 日

3 分钟阅读

数学家向人工智能提出重大挑战：向我们展示你的工作

对人工智能行业声称在不提供透明度的情况下证明数学结果的说法感到沮丧，一个领先的学者团队提出了一种更好的方法

作者：Joseph Howlett 编辑：Claire Cameron

阿尔弗雷德·格沙伊特/盖蒂图片社

开发一种能够进行纯数学计算的人工智能的竞赛已经开始，顶级数学家们刚刚向与他们的研究相关的实际的、未解决的问题进行了测试，提出了挑战。该团队给人工智能系统一周的时间来解决这些问题。

这项名为“First Proof”的工作在上周四发布的预印本中有详细介绍。

“这些都是全新的问题，在任何法学硕士（大型语言模型）的训练数据中都找不到，”麻省理工学院数学家安德鲁·萨瑟兰（Andrew Sutherland）说道，他没有参与新的考试。他补充道：“这似乎是一个比我迄今为止见过的任何实验都要好的实验。”他指的是测试人工智能数学能力的困难。

如果您喜欢这篇文章，请考虑通过订阅来支持我们屡获殊荣的新闻事业。通过购买订阅，您将有助于确保有关塑造当今世界的发现和想法的影响力故事的未来。

人工智能行业已经开始专注于纯数学。由于数学证明遵循可检查的逻辑步骤序列，因此其结论的真假超出了任何主观衡量标准。这可能提供了一种更好的方法来比较法学硕士的实力，而不是评估他们的诗歌的说服力。致力于数学人工智能的初创企业最近招募了一些知名数学家。

没有一个证据是惊天动地的。它们是“引理”，数学家用这个词来描述他们在获得更重要结果的过程中所证明的无数微小定理。引理通常不会作为独立论文发表。

致力于证明的实际的测试透明度世界的结果的比较法法学硕士全新的人工智能相关的提出引理订阅数学发布的开始检查的问题未解决的计算的领先的进行团队证明没有数学家