HyperAI

DeepMath-103K-Datensatz Zum Mathematischen Denken

Datum

vor 15 Tagen

Organisation

Shanghai Jiao Tong Universität

Veröffentlichungs-URL

huggingface.co

Download-Hilfe

DeepMath-103K ist ein umfangreicher Datensatz zum Trainieren und Bewerten mathematischer Denkmodelle, der 2025 gemeinsam von Tencent und der Shanghai Jiao Tong University veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:DeepMath-103K: Ein umfangreicher, anspruchsvoller, dekontaminierter und überprüfbarer mathematischer Datensatz zur Weiterentwicklung des Denkens".

Der Datensatz konzentriert sich auf mathematische Probleme der Stufen 5–9 und deckt Algebra, Differential- und Integralrechnung, Zahlentheorie, Geometrie, Wahrscheinlichkeit, diskrete Mathematik und andere Bereiche ab. Der Schwerpunkt liegt auf der Herausforderung komplexer Denkfähigkeiten. Der Datensatz führt außerdem eine detaillierte Dekontaminationsverarbeitung für gängige Benchmarks durch semantisches Matching durch, um Testsatzlecks zu minimieren und eine faire Modellbewertung zu fördern.

Hierarchische Klassifizierung der von DeepMath-103K behandelten mathematischen Themen