HyperAI

OpenR1-Math-220k-Datensatz Zum Mathematischen Denken

Datum

vor 3 Monaten

Größe

3.51 GB

Organisation

Veröffentlichungs-URL

huggingface.co

Lizenz

Apache 2.0

OpenR1-Math-220k ist ein umfangreicher Datensatz zum mathematischen Denken, der 2025 vom Open R1-Team veröffentlicht wurde, um die Lücke in den synthetischen Daten von DeepSeek R1 zu schließen. Der Datensatz enthält 220.000 hochwertige mathematische Probleme und ihre Argumentationstrajektorien, die aus 800.000 von DeepSeek R1 generierten Argumentationstrajektorien abgeleitet sind.

Der Datensatz ist in zwei Teile gegliedert:

  • Standard (94.000 Probleme): Dieser Teil der Daten zeigt nach einer überwachten Feinabstimmung (SFT) die beste Leistung.
  • erweitert (131.000 Fragen): Dieser Teil der Daten enthält zusätzliche NuminaMath 1.5-Datenquellen, wie z. B. cn_k12, das weitere Inferenzformeln bereitstellt.
OpenR1-Math-220k.torrent
Seeding 0Herunterladen 2Abgeschlossen 41Gesamtdownloads 69
  • OpenR1-Math-220k/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • OpenR1-Math-220k.zip
          3.51 GB