在秘密会议中,数学家努力超越AI

全球领先的数学家对人工智能的熟练工人工作感到震惊

来源:科学美国人

在秘密数学会议上,研究人员很难超越AI

全球领先的数学家对人工智能的熟练工人工作感到震惊

lyndie chiou由克拉拉·莫斯科维茨(Clara Moskowitz)编辑

lyndie chiou 由Clara Moskowitz编辑 Clara Moskowitz
Yuichiro Chino/Getty Images

在五月中旬的一个周末,一个秘密的数学会议召集了。世界上最著名的数学家中有30名前往加利福尼亚州伯克利,其中一些人来自英国。该小组的成员在与“推理”聊天机器人的摊牌中面对面,该聊天机器人的任务是解决他们已设计的问题,以测试其数学梅特尔。在将教授级的问题提出了两天的时间之后,研究人员被惊呆了,发现它能够回答世界上一些最难解决的问题。弗吉尼亚大学的数学家肯·奥诺(Ken Ono)说:“我有同事说这些模式正在接近数学天才。”

“推理”聊天机器人 世界上最困难的解决问题

所讨论的聊天机器人由所谓的大型语言模型(LLM)O4-Mini提供动力。它通过Openai培训,能够进行高度复杂的扣除额。 Google的等效Gemini 2.5 Flash具有类似的能力。就像较早版本的Chatgpt供电的LLM一样,O4-Mini学会了按顺序预测下一个单词。但是,与较早的LLM相比,O4-Mini及其等效物是重量较轻,更灵活的模型,可以在专业数据集上训练,并具有更强的人类增强。该方法导致聊天机器人能够比传统LLM更深入地研究数学中的复杂问题。

O4-Mini 双子座2.5闪存 传统LLM 任务epoch ai,一个基准的非营利组织,以提出300个数学问题 少于2% 支持科学新闻业 订阅 Frontiermath O4-Mini 双子座2.5闪存 传统LLM 任务epoch ai,一个基准的非营利组织,以提出300个数学问题

少于2%

支持科学新闻业 订阅Frontiermath