Command Palette
Search for a command to run...
MathNetマルチモーダル数学ベンチマーク推論データセット
MathNetは、MITの研究チームがキング・アブドラ科学技術大学およびその他の機関と共同で2026年に公開した、大規模で多言語・マルチモーダルな数学的推論データセットです。関連する研究論文は以下のとおりです。 MathNet:数学的推論と検索のためのグローバルなマルチモーダルベンチマークこの手法は、オリンピックレベルの数学的推論および構造化検索タスクにおける大規模モデルの能力を評価および向上させることを目的としており、数学的推論評価、RAG研究、およびマルチモーダルAIトレーニングで広く使用されています。 このデータセット(バージョンv0)には、27,817問のエキスパートレベルの数学問題とその標準解答が収録されています。58の国と地域から17言語で出題された公式数学コンテストの問題を網羅しており、5,148問の図解付き問題と、合計7,541点の幾何学的およびグラフによる図解が含まれています。このデータセットは、代数、幾何学、数論、組み合わせ論、微積分、確率と統計、およびその他のオリンピック数学知識体系をカバーしています。数学問題の解決、数学的意味検索(構造的に同等で類似した問題の特定)、および検索強化問題解決という3つのベンチマークタスクをサポートします。

引用
@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}