麻省理工学院的科学家们建立了世界上最大的奥林匹克级数学题库,并向所有人开放

来自 47 个国家的 30,000 多个竞赛数学问题的新数据集为人工智能研究人员提供了更难的测试,也为世界各地的学生提供了更好的训练场。

来源:MIT新闻 - 人工智能

每年,参加国际数学奥林匹克 (IMO) 的国家都会带着一本包含他们最好、最原创问题的小册子。这些小册子在各代表团之间共享,然后悄然消失。没有人系统地收集、清理它们并提供它们,无论是供人工智能研究人员测试数学推理的极限,还是供世界各地主要靠自己训练参加这些比赛的学生使用。

麻省理工学院计算机科学与人工智能实验室 (CSAIL)、阿卜杜拉国王科技大学 (KAUST) 以及 HUMAIN 公司的研究人员现在已经做到了这一点。

MathNet 是迄今为止创建的最大的基于证明的数学问题的高质量数据集。它包含 30,000 多个专家撰写的问题和解决方案,涵盖 47 个国家、17 种语言和 143 个竞赛,比同类数据集大五倍。这项工作将于本月晚些时候在巴西举行的国际学习表征会议(ICLR)上展示。

MathNet 的不同之处不仅在于它的大小,还在于它的广度。以往的奥林匹克级别数据集几乎全部来自美国和中国的比赛。 MathNet 横跨六大洲的数十个国家,涵盖 17 种语言,包括基于文本和图像的问题和解决方案,并跨越四十年的数学竞赛。目标是捕捉全球数学界存在的全方位数学观点和解决问题的传统,而不仅仅是最明显的观点和解决问题的传统。

“每个国家都会带来一本关于其最新颖和最具创造性问题的小册子,”麻省理工学院博士生、该论文的主要作者 Shaden Alshammari 说。 “他们互相分享这些小册子,但没有人努力收集、清理并上传到网上。”

MathNet 可在 mathnet.csail.mit.edu 上公开获取。