DeepMath-103K-Datensatz Zum Mathematischen Denken
Datum
Veröffentlichungs-URL
Kategorien
DeepMath-103K ist ein umfangreicher Datensatz zum Trainieren und Bewerten mathematischer Denkmodelle, der 2025 gemeinsam von Tencent und der Shanghai Jiao Tong University veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:DeepMath-103K: Ein umfangreicher, anspruchsvoller, dekontaminierter und überprüfbarer mathematischer Datensatz zur Weiterentwicklung des Denkens".
Der Datensatz konzentriert sich auf mathematische Probleme der Stufen 5–9 und deckt Algebra, Differential- und Integralrechnung, Zahlentheorie, Geometrie, Wahrscheinlichkeit, diskrete Mathematik und andere Bereiche ab. Der Schwerpunkt liegt auf der Herausforderung komplexer Denkfähigkeiten. Der Datensatz führt außerdem eine detaillierte Dekontaminationsverarbeitung für gängige Benchmarks durch semantisches Matching durch, um Testsatzlecks zu minimieren und eine faire Modellbewertung zu fördern.
