Command Palette
Search for a command to run...
MathNet 多模态数学基准推理数据集
MathNet 是由 MIT 团队联合阿卜杜拉国王科技大学等机构于 2026 年发布的一个大规模多语言、多模态数学推理数据集,相关论文成果为 MathNet: a Global Multimodal Benchmark for Mathematical Reasoning and Retrieval,旨在评估与提升大模型在奥林匹克级数学推理与结构化检索任务中的能力,广泛应用于用于数学推理评测、 RAG 研究及多模态 AI 训练等方向。 该数据集为 v0 版本,共收录 27,817 道专家级数学试题及配套标准解答,涵盖 58 个国家和地区、 17 种语言的官方数学竞赛真题,其中包含 5,148 道配图试题、共计 7,541 张几何及图形辅助配图。数据集覆盖代数、几何、数论、组合数学、微积分、概率统计等奥数知识体系,支持数学问题求解、数学语义检索(识别结构等价及相似试题)、检索增强问题求解 3 个基准任务。

Citation
@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}