MathX-5M-Datensatz Zum Mathematischen Denken
Datum
vor 2 Monaten
Veröffentlichungs-URL
Lizenz
MIT
Kategorien
MathX ist ein Datensatz zum mathematischen Denken, der für die anweisungenbasierte Modelloptimierung und Feinabstimmung bestehender Modelle zur Erweiterung der Denkfähigkeiten entwickelt wurde. Der Datensatz ist das bislang größte und umfassendste Korpus öffentlich verfügbarer Daten zum mathematischen Denken.
Der Datensatz enthält 5 Millionen sorgfältig ausgewählte Schritt-für-Schritt-Denkbeispiele. Jedes Beispiel enthält eine Problemstellung, einen detaillierten Denkprozess und eine verifizierte korrekte Lösung. Die Beispiele decken Arithmetik und Zahlentheorie, Algebra und Polynommathematik, Geometrie und Trigonometrie sowie Infinitesimalrechnung und Analysis ab.
Problemkomplexitätsverteilung
- Grundstufe (30%): Grundlegende mathematische Konzepte und Operationen
- Mittelstufe (30%): Mehrstufige Probleme, die Schlussfolgerungsketten erfordern
- Fortgeschritten (40%): Komplexe mathematische Herausforderungen und Beweise
Datensatzfunktionen:
- Vielfalt: Umfassende Abdeckung der Mathematik von der Grundrechenart bis zur höheren Mathematik
- Qualität: Mehrstufiger Screening- und Verifizierungsprozess
- Argumentation: Schritt-für-Schritt-Lösungen mit detaillierten mathematischen Ideen
- Genauigkeit: Antworten durch Reinforcement Learning verifiziert und auf Richtigkeit überprüft