HyperAI

OpenThoughts2-1M Reasoning-Datensatz

Datum

vor 13 Tagen

Größe

6.91 GB

Veröffentlichungs-URL

huggingface.co

OpenThoughts2-1M ist ein Open-Source-Reasoning-Datensatz, der 2025 von Open Thoughts veröffentlicht wurde. Die zugehörigen Ergebnisse sind:OpenThoughts: Datenrezepte für Schlussfolgerungsmodelle".

Der Datensatz basiert auf dem OpenThoughts-114k-Datensatz und ergänzt bestehende Datensätze wie OpenR1 sowie weitere Daten aus den Bereichen Mathematik und Code-Reasoning. Die Daten enthalten 1 Million hochwertige Beispiele aus den Bereichen Mathematik, Naturwissenschaften, Code und Rätsel. Die Leistung des mit diesem Datensatz trainierten OpenThinker2-Modells ist vergleichbar mit der des DeepSeek-R1-Distill-Modells.

Datenstruktur

open-thoughts2M.torrent
Seeding 1Herunterladen 0Abgeschlossen 4Gesamtdownloads 7
  • open-thoughts2M/
    • README.md
      1.27 KB
    • README.txt
      2.54 KB
      • data/
        • open-thoughts2M.zip
          6.91 GB