详细内容或原文请订阅后点击阅览
AI刚刚在世界上最艰难的数学比赛中获得了金牌,甚至没有接受过训练
机器能否超越地球上最聪明的年轻数学家?
来源:ZME科学国际数学奥林匹克运动会(IMO)是一个聪明的战场,世界上最有才华的青少年数学家在那里遇到了艰难的数学问题。长期以来,它一直被认为是杰出人才的温床。但是现在,来自OpenAI的实验AI解决了六个问题中的五个,基本上是获得了金牌得分。
您可能很想认为这归功于强大的,蛮力的计算或通过大型数学数据库进行搜索。事实并非如此。这些问题无法通过原始计算解决,并且它们是为了迫使求解器在框外思考。这正是我们曾经认为人类专属的逻辑和创造性的推理。 AI钉了它。
AI可以做一些真实的思维
数学奥林匹克问题不是将数字插入公式中。它们更像是复杂的障碍课程,看起来很简单,但需要几层聪明和直觉。即使参与者找到正确的方法,参与者也只能解决部分问题。传统上,大型语言模型(如chatgpt)在这种任务中挣扎。
但这改变了。来自Openai的未发行模型在42分中获得了35分,将其列为全球最高10%的人类参赛者。这相当于金牌表现,这是IMO中最高的成就。对于AI,这是向新领域的转变:最高级别的持续,多步,演绎的推理。简而言之,机器不只是学习数学。它学会了如何思考数学。
考虑Alexander Wei是OpenAI的研究科学家,从事LLMS和推理的工作,在X上发布了这种情况。 发布在x 上 “我们在与人类参赛者相同的规则下对2025 IMO问题进行了评估:两个4.5小时的考试课程,没有工具或互联网,阅读官方问题陈述并编写自然语言证明。”
Alexander Wei是OpenAI的研究科学家,从事LLMS和推理的工作,在X上发布了这种情况。发布在x“我们在与人类参赛者相同的规则下对2025 IMO问题进行了评估:两个4.5小时的考试课程,没有工具或互联网,阅读官方问题陈述并编写自然语言证明。”