ChatGPT 首次解决了未经证实的几何数学问题

新研究发现ChatGPT-5.2可以生成原始数学证明,引入“vibe-proving”作为一种新的人工智能推理方法。人工智能加速了发现,但人工验证仍然是必要的。 VUB 数据分析实验室的研究人员报告称,商业语言模型可以产生原始的数学证明。在他们的研究中,团队表明 OpenAI 的大型语言模型 ChatGPT-5.2 (Thinking) [...]

来源:SciTech日报

新研究发现ChatGPT-5.2可以生成原始数学证明,引入“vibe-proving”作为一种新的人工智能推理方法。人工智能加速了发现,但人工验证仍然是必要的。

VUB 数据分析实验室的研究人员报告称,商业语言模型可以产生原始的数学证明。在他们的研究中,该团队表明 OpenAI 的大型语言模型 ChatGPT-5.2(Thinking)能够自行解决数学问题。

该案例重点证明了数学家冉和腾提出的2024猜想。猜想是基于模式或重复结果被认为是正确的陈述,但尚未得到正式证明。一旦建立了有效的证明,猜想就成为定理。

根据该研究,最终的证据来自于 ChatGPT 的 7 次聊天会话以及该论点的 4 个不断演变的版本。该模型在探索可能的方法方面发挥了关键作用,而人类研究人员则确保推理正确且逻辑完整。

ChatGPT 在数学发现中的作用

研究人员发现 ChatGPT-5.2(Thinking)在有限的人类输入下开发了大部分证明结构。正如他们所指出的,“通过数据分析实验室,我们是第一个证明商业法学硕士可以独立开发原始数学证明的人之一。”

“我一直怀疑 ChatGPT 可以帮助我证明未解决的数学问题,”Brecht Verbeken(VUB 数据分析实验室研究小组的博士后研究员)说道。 “但我对它的效率感到惊讶。”

人类验证和人工智能研究的未来

尽管该模型做出了巨大贡献,但研究人员强调,人类的参与对于最终验证和解决证明中任何剩余的差距仍然至关重要。该过程还强调了语言模型最有帮助的地方以及验证中仍然存在挑战的地方。

DOI:10.48550/arXiv.2602.18918。

在 Google 和 Google 新闻上关注我们。