详细内容或原文请订阅后点击阅览
AI和数学的下一步是什么
麻省理工学院技术评论的下一系列介绍了跨越行业,趋势和技术,可以让您首先了解未来。您可以在这里阅读其余的内容。 DARPA告诉它的方式,数学过去被困在过去。 4月,美国国防高级研究项目局启动了一项名为Expmath的新倡议 - Short…
来源:MIT Technology Review _人工智能今年,许多LRMS试图逐步解决问题,而不是吐出对他们的第一个结果,在美国邀请赛数学考试(AIME)上取得了很高的分数,这是对美国高中数学前5%的测试。
美国邀请数学考试的高分同时,将LLM与某种事实检查系统相结合的少数新型混合动力模型也取得了突破。巴西圣保罗大学的数学家艾米丽·德·奥利维拉·桑托斯(Emily de Oliveira Santos)指出了Google Deepmind的字母隔壁,该系统将LLM与Deepmind的游戏玩法Alphazero结合在一起,是一个关键的里程碑。去年,Alphaproof成为第一个在国际数学奥林匹克运动会上与银牌获得者表现相匹配的计算机计划,这是世界上最负盛名的数学比赛之一。
匹配国际数学奥林匹克银牌获得者的表现和5月,一个名为Alphaevolve的Google DeepMind模型发现了比人类尚未提出的任何东西都提出的更好的结果。
发现的结果比人类尚未提出的更好的结果正在进行的上升很明显。 De Oliveira Santos说:“ GPT-4在本科水平之外做不到的数学要做。” “我记得在发布时对其进行拓扑问题进行了测试,而且它在没有完全丢失的情况下写了几行。”但是,当她给Openai的O1带来同样的问题时,一月份发布了LRM时,它钉上了它。
这是否意味着这样的模型都将成为DARPA希望的那种合着者?她说,不一定是数学奥林匹克问题通常涉及能够执行巧妙的技巧,而研究问题更具探索性,并且经常有很多动人的作品。”一种解决问题的成功可能不会延续到另一种问题上。