HyperAIHyperAI

Command Palette

Search for a command to run...

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

Datum

in 4 Stunden

Organisation

MIT

Paper-URL

2604.18584

Lizenz

CC BY 4.0

MathNet ist ein umfangreicher, mehrsprachiger und multimodaler Datensatz für mathematisches Denken, der 2026 von einem Team des MIT in Zusammenarbeit mit der King Abdullah University of Science and Technology und anderen Institutionen veröffentlicht wurde. Die zugehörigen Forschungsarbeiten sind folgende: MathNet: ein globaler multimodaler Benchmark für mathematisches Denken und AbrufenZiel ist es, die Fähigkeiten großer Modelle bei mathematischen Denkaufgaben und strukturierten Suchaufgaben auf olympischem Niveau zu bewerten und zu verbessern. Es wird häufig in der Bewertung mathematischer Denkprozesse, der RAG-Forschung und im multimodalen KI-Training eingesetzt. Dieser Datensatz (Version v0) enthält 27.817 mathematische Aufgaben auf Expertenniveau sowie deren Standardlösungen. Er umfasst offizielle Aufgaben von Mathematikwettbewerben aus 58 Ländern und Regionen in 17 Sprachen, darunter 5.148 illustrierte Aufgaben mit insgesamt 7.541 geometrischen und grafischen Darstellungen. Der Datensatz deckt Algebra, Geometrie, Zahlentheorie, Kombinatorik, Analysis, Wahrscheinlichkeitsrechnung und Statistik sowie weitere Wissensgebiete der Mathematikolympiaden ab. Er unterstützt drei Benchmark-Aufgaben: das Lösen mathematischer Aufgaben, die mathematische semantische Suche (Identifizierung strukturell äquivalenter und ähnlicher Aufgaben) und die Verbesserung der Suchergebnisse.

Datensatzübersicht
Datensatzübersicht

Zitat

@inproceedings{alshammari2026mathnet,
title = {MathNet: A Global Multimodal Benchmark for Mathematical
Reasoning and Retrieval},
author = {Alshammari, Shaden and Wen, Kevin and Zainal, Abrar and
Hamilton, Mark and Safaei, Navid and Albarakati, Sultan and
Freeman, William T. and Torralba, Antonio},
booktitle = {International Conference on Learning Representations},
year = {2026},
url = {https://mathnet.mit.edu}
}

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp