字母度计:用于几何>的奥林匹亚级AI系统

在数学中推进AI推理

来源:DeepMind - 新闻与博客

科学

字母度计:用于几何>的奥林匹亚级AI系统

于2024年1月出版。
已发布
2024年1月17日
作者
Trieu Trinh和Thang Luong

我们的AI系统超过了几何问题的最新方法,在数学中推进了AI推理

反映了古希腊的奥林匹克精神,国际数学奥林匹克运动会是世界上最聪明的高中数学家的现代舞台。竞争不仅展示了年轻的才华,而且已经成为数学和推理高级AI系统的测试基础。

国际数学奥林匹克运动会

在今天在自然界发表的一篇论文中,我们引入了字母计量法,该系统是一种AI系统,该系统在接近人类奥林匹克金医师的水平上解决了复杂的几何问题,这是AI表现的突破。在对30个奥林匹克几何问题的基准测试测试中,在标准奥林匹克运动会时间限制内求解了25个字母计量。为了进行比较,先前的最新系统解决了这些几何问题的10个,而人类金牌得主则解决了25.9个问题。

自然
在我们从2000年至2022年的奥林匹克运动会中编写的30个奥林匹克几何学问题(IMO-AG-30)的基准测试集(IMO-AG-30)中,字母测定法在竞争时间限制下解决了25个问题。这是在这些相同问题上的人类金牌得主的平均得分。以前的最先进方法,称为“ Wu的方法”,解决了10。

AI系统由于缺乏推理技能和培训数据而经常在几何和数学上的复杂问题上挣扎。 AlphageMementry的系统将神经语言模型的预测能力与规则结合的扣除引擎结合在一起,该引擎可以同时使用解决方案。通过开发一种生成大量合成训练数据的方法 - 1亿个独特的示例 - 我们可以训练电费计量法而无需任何人类演示,从而避开了数据瓶颈。

字母计量法和模型

思考,快速而慢