Openai在著名的数学比赛中赢得了黄金 - 为什么这比您想象的重要 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

Openai在著名的数学比赛中赢得了黄金 - 为什么这比您想象的重要

2025年7月21日 17:34 33 Comments

公司的实验推理模型并未经过微调来解决数学问题，而是接受了一般问题解决方案的培训。

来源:ZDNet | 机器人新闻

OpenAi

OpenAI在竞赛中实现了一个新的里程碑，以建立可以通过复杂的数学问题来推理自己的AI模型。

周六，该公司宣布，其中一种模型在国际数学奥林匹克（IMO）上取得了金牌水平的表现，被广泛认为是世界上最负盛名，最困难的数学竞赛。

宣布

至关重要的是，获胜模型并非专门用于解决IMO问题，就像DeepMind的Alphago这样的早期系统（在2016年都击败了世界领先的GO Player），在一个非常狭窄的任务特定领域的大规模数据集中接受了培训。相反，获胜者是一种通用推理模型，旨在通过有条不紊地使用自然语言思考问题。

击败世界领先的GO

也：chatgpt降低了吗？你并不孤单。这就是Openai所说的

changpt降低了吗？你并不孤单。这就是Openai所说的

“这是在做数学的LLM，而不是特定的正式数学系统，” Openai在其X帖子中写道。 “这是我们对通用情报的主要努力的一部分。”

（披露：ZDNET的母公司齐夫·戴维斯（Ziff Davis）于2025年4月提起针对Openai的诉讼，指控它侵犯了Ziff Davis在培训和运营其AI系统方面的版权。

在这一点上，关于所使用的模型的身份并不多。 OpenAI的研究人员亚历山大·韦（Alexander Wei）领导了IMO研究，他在X帖子中称其为“实验性推理LLM”，其中包括一枚金牌上花环的草莓插图，这表明它是在公司的O1家族推理模型上建造的，该模型于9月在9月首次亮相。

X POST O1推理模型家族

“要清楚：我们很快就会发布GPT-5，但是我们在IMO上使用的模型是一个单独的实验模型，” OpenAI在X上添加。它使用了将在未来模型中显示的新研究技术 - 但我们不打算发布具有多个月能力的模型。”

长

培训花环 GO 推理模型复杂的 Ziff Davis 使用 LLM 模型诉讼 Openai 问题领先的单独的特定的数据集重要的自己的水平的使用的数学实验模型金牌 IMO 母公司情报的研究人员模型的里程碑困难的大规模 AI 狭窄的数学的