Command Palette
Search for a command to run...
MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz
Datum
Paper-URL
Lizenz
CC BY 4.0
MathNet ist ein umfangreicher, mehrsprachiger und multimodaler Datensatz für mathematisches Denken, der 2026 von einem Team des MIT in Zusammenarbeit mit der King Abdullah University of Science and Technology und anderen Institutionen veröffentlicht wurde. Die zugehörigen Forschungsarbeiten sind folgende: MathNet: ein globaler multimodaler Benchmark für mathematisches Denken und AbrufenZiel ist es, die Fähigkeiten großer Modelle bei mathematischen Denkaufgaben und strukturierten Suchaufgaben auf olympischem Niveau zu bewerten und zu verbessern. Es wird häufig in der Bewertung mathematischer Denkprozesse, der RAG-Forschung und im multimodalen KI-Training eingesetzt. Dieser Datensatz (Version v0) enthält 27.817 mathematische Aufgaben auf Expertenniveau sowie deren Standardlösungen. Er umfasst offizielle Aufgaben von Mathematikwettbewerben aus 58 Ländern und Regionen in 17 Sprachen, darunter 5.148 illustrierte Aufgaben mit insgesamt 7.541 geometrischen und grafischen Darstellungen. Der Datensatz deckt Algebra, Geometrie, Zahlentheorie, Kombinatorik, Analysis, Wahrscheinlichkeitsrechnung und Statistik sowie weitere Wissensgebiete der Mathematikolympiaden ab. Er unterstützt drei Benchmark-Aufgaben: das Lösen mathematischer Aufgaben, die mathematische semantische Suche (Identifizierung strukturell äquivalenter und ähnlicher Aufgaben) und die Verbesserung der Suchergebnisse.

Zitat
@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.