Command Palette
Search for a command to run...
OpenR1-Math-220k-Datensatz Zum Mathematischen Denken
Date
Size
License
Apache 2.0
OpenR1-Math-220k ist ein umfangreicher Datensatz zum mathematischen Denken, der 2025 vom Open R1-Team veröffentlicht wurde, um die Lücke in den synthetischen Daten von DeepSeek R1 zu schließen. Der Datensatz enthält 220.000 hochwertige mathematische Probleme und ihre Argumentationstrajektorien, die aus 800.000 von DeepSeek R1 generierten Argumentationstrajektorien abgeleitet sind.
Der Datensatz ist in zwei Teile gegliedert:
- Standard (94.000 Probleme): Dieser Teil der Daten zeigt nach einer überwachten Feinabstimmung (SFT) die beste Leistung.
- erweitert (131.000 Fragen): Dieser Teil der Daten enthält zusätzliche NuminaMath 1.5-Datenquellen, wie z. B. cn_k12, das weitere Inferenzformeln bereitstellt.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.