HyperAIHyperAI

Command Palette

Search for a command to run...

MathNet 多模态数学基准推理数据集

日期

4 小时内

数据集组织

MIT

论文 URL

2604.18584

许可证

CC BY 4.0

MathNet 是由 MIT 团队联合阿卜杜拉国王科技大学等机构于 2026 年发布的一个大规模多语言、多模态数学推理数据集,相关论文成果为 MathNet: a Global Multimodal Benchmark for Mathematical Reasoning and Retrieval,旨在评估与提升大模型在奥林匹克级数学推理与结构化检索任务中的能力,广泛应用于用于数学推理评测、 RAG 研究及多模态 AI 训练等方向。 该数据集为 v0 版本,共收录 27,817 道专家级数学试题及配套标准解答,涵盖 58 个国家和地区、 17 种语言的官方数学竞赛真题,其中包含 5,148 道配图试题、共计 7,541 张几何及图形辅助配图。数据集覆盖代数、几何、数论、组合数学、微积分、概率统计等奥数知识体系,支持数学问题求解、数学语义检索(识别结构等价及相似试题)、检索增强问题求解 3 个基准任务。

数据集概览
数据集概览

Citation

@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供