Command Palette
Search for a command to run...
OpenR1-Math-220k-Datensatz Zum Mathematischen Denken
Datum
Größe
Lizenz
Apache 2.0
OpenR1-Math-220k ist ein umfangreicher Datensatz zum mathematischen Denken, der 2025 vom Open R1-Team veröffentlicht wurde, um die Lücke in den synthetischen Daten von DeepSeek R1 zu schließen. Der Datensatz enthält 220.000 hochwertige mathematische Probleme und ihre Argumentationstrajektorien, die aus 800.000 von DeepSeek R1 generierten Argumentationstrajektorien abgeleitet sind.
Der Datensatz ist in zwei Teile gegliedert:
- Standard (94.000 Probleme): Dieser Teil der Daten zeigt nach einer überwachten Feinabstimmung (SFT) die beste Leistung.
- erweitert (131.000 Fragen): Dieser Teil der Daten enthält zusätzliche NuminaMath 1.5-Datenquellen, wie z. B. cn_k12, das weitere Inferenzformeln bereitstellt.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.