数学家质疑国际数学奥林匹克的AI表现

AI模型据说在国际数学奥林匹克问题上表现出色,但是他们如何获得答案使我们想起了为什么我们仍然需要人们进行数学

来源:科学美国人

我高中的定义记忆是一项九小时的数学考试,只有六个问题。六名最佳得分手赢得了美国国际数学奥林匹克(IMO)的球队,这是世界上最长的高中生数学竞赛。我没有晋级,但无论如何还是一名终身数学教授。

今年的奥林匹克运动会上个月在澳大利亚的阳光海岸举行,有一个不寻常的杂物。尽管世界各地的110名学生使用笔和纸来解决复杂的数学问题,但几家AI公司悄悄地测试了在计算机化考试近似的开发中开发的新模型。结束仪式结束后,OpenAI和后来的Google DeepMind宣布,他们的模型获得了(非官方的)金牌,以解决六个问题中的五枚。像Openai的SébastienBubeck这样的研究人员庆祝了这些模型的成功,这是行业的“月球降落时刻”。

OpenAi Google DeepMind 月亮着陆时刻

但是他们是吗? AI会取代专业数学家吗?我仍在等待证明。

专业数学家

支持科学新闻业

如果您喜欢这篇文章,请考虑通过订阅来支持我们屡获殊荣的新闻。通过购买订阅,您可以帮助确保有关当今世界的发现和想法有影响力的故事的未来。

订阅 MATHARENA.AI 所有人都无法产生一个完全正确的解决方案

但我仍然不担心。

最新型号在一次测试中获得了很好的成绩(就像许多学生一样),而面对面的比较并不完全公平。这些模型通常采用“最佳N”策略,生成多个解决方案,然后对自己进行分级以选择最强的方法。这类似于让几个学生独立工作,然后聚在一起选择最好的解决方案,只提交该解决方案。如果允许人类参赛者此选项,他们的分数也可能会提高。

n terence tao mastodon