HyperAIHyperAI

Command Palette

Search for a command to run...

MathNetマルチモーダル数学ベンチマーク推論データセット

日付

4時間後

データセット構成

MIT

Paper URL

2604.18584

ライセンス

CC BY 4.0

MathNetは、MITの研究チームがキング・アブドラ科学技術大学およびその他の機関と共同で2026年に公開した、大規模で多言語・マルチモーダルな数学的推論データセットです。関連する研究論文は以下のとおりです。 MathNet:数学的推論と検索のためのグローバルなマルチモーダルベンチマークこの手法は、オリンピックレベルの数学的推論および構造化検索タスクにおける大規模モデルの能力を評価および向上させることを目的としており、数学的推論評価、RAG研究、およびマルチモーダルAIトレーニングで広く使用されています。 このデータセット(バージョンv0)には、27,817問のエキスパートレベルの数学問題とその標準解答が収録されています。58の国と地域から17言語で出題された公式数学コンテストの問題を網羅しており、5,148問の図解付き問題と、合計7,541点の幾何学的およびグラフによる図解が含まれています。このデータセットは、代数、幾何学、数論、組み合わせ論、微積分、確率と統計、およびその他のオリンピック数学知識体系をカバーしています。数学問題の解決、数学的意味検索(構造的に同等で類似した問題の特定)、および検索強化問題解決という3つのベンチマークタスクをサポートします。

データセットの概要
データセットの概要

引用

@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています