详细内容或原文请订阅后点击阅览
Openai在著名的数学比赛中赢得了黄金 - 为什么这比您想象的重要
公司的实验推理模型并未经过微调来解决数学问题,而是接受了一般问题解决方案的培训。
来源:ZDNet | 机器人新闻OpenAI在竞赛中实现了一个新的里程碑,以建立可以通过复杂的数学问题来推理自己的AI模型。
周六,该公司宣布,其中一种模型在国际数学奥林匹克(IMO)上取得了金牌水平的表现,被广泛认为是世界上最负盛名,最困难的数学竞赛。
宣布至关重要的是,获胜模型并非专门用于解决IMO问题,就像DeepMind的Alphago这样的早期系统(在2016年都击败了世界领先的GO Player),在一个非常狭窄的任务特定领域的大规模数据集中接受了培训。相反,获胜者是一种通用推理模型,旨在通过有条不紊地使用自然语言思考问题。
击败世界领先的GO也:chatgpt降低了吗?你并不孤单。这就是Openai所说的
changpt降低了吗?你并不孤单。这就是Openai所说的“这是在做数学的LLM,而不是特定的正式数学系统,” Openai在其X帖子中写道。 “这是我们对通用情报的主要努力的一部分。”
(披露:ZDNET的母公司齐夫·戴维斯(Ziff Davis)于2025年4月提起针对Openai的诉讼,指控它侵犯了Ziff Davis在培训和运营其AI系统方面的版权。
在这一点上,关于所使用的模型的身份并不多。 OpenAI的研究人员亚历山大·韦(Alexander Wei)领导了IMO研究,他在X帖子中称其为“实验性推理LLM”,其中包括一枚金牌上花环的草莓插图,这表明它是在公司的O1家族推理模型上建造的,该模型于9月在9月首次亮相。
X POST O1推理模型家族“要清楚:我们很快就会发布GPT-5,但是我们在IMO上使用的模型是一个单独的实验模型,” OpenAI在X上添加。它使用了将在未来模型中显示的新研究技术 - 但我们不打算发布具有多个月能力的模型。”
长