HyperAIHyperAI

Command Palette

Search for a command to run...

MIT 构建全球最大奥林匹克数学题集并免费开放

麻省理工学院(MIT)计算机科学实验室(CSAIL)、阿卜杜拉国王科技大学(KAUST)与 HUMAIN 公司合作,建立了全球最大的数学奥林匹克难题集合,并免费向公众开放。该数据集名为 MathNet,包含超过 3 万个专家编写的题目及解答,涵盖 47 个国家、17 种语言和 143 项竞赛,规模是同类数据集中最大者的五倍。 MathNet 的独特之处在于其全球覆盖面和数据的权威性。以往的数据集多源自美国和中国的竞赛,而 MathNet 收录了过去四十年来全球各地的官方竞赛册,其中包括大量非英语国家的手写扫描件。这些数据由资深 IMO 成员 Navid Safaei 多年来手工整理,确保了题目来源的官方性和解答的严谨性。对于缺乏专业指导的自学学生而言,这是一个前所未有的高质量资源。 研究团队利用该数据集测试了多种人工智能模型,揭示了当前 AI 在数学推理领域的复杂现状。虽然部分顶级模型在标准基准上表现优异,但在 MathNet 的 6400 道题主基准上,表现最好的 GPT-5 平均得分仅为 69.3%,近三分之一的难题未能攻克。特别是当题目包含图像或涉及蒙古语等非通用语言时,模型性能显著下降,暴露出视觉推理和多语言理解能力的短板。 此外,该数据集还测试了模型识别题目间深层数学结构相似性的能力,发现现有模型在此方面表现不佳。研究者认为,MathNet 不仅为 AI 提供了更均衡的数学文化训练数据,有助于消除对英语和中文数据的过度依赖,也为人类学生和研究者提供了一个验证新问题原创性的标准工具,有望推动数学教育及 AI 推理能力的进一步发展。

相关链接

MIT 构建全球最大奥林匹克数学题集并免费开放 | 热门资讯 | HyperAI超神经