HyperAIHyperAI

Command Palette

Search for a command to run...

Chinesische DeepSeek R1-Destillationsdaten. 110.000 Chinesische Daten Basierend Auf Dem DeepSeek-R1-Destillationsdatensatz

Datum

vor 9 Monaten

Größe

231.15 MB

Lizenz

Apache 2.0

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Dieser Datensatz ist ein chinesischer Open-Source-destillierter vollwertiger R1-Datensatz. Der Datensatz enthält nicht nur mathematische Daten, sondern auch eine große Menge allgemeiner Daten mit einem Gesamtumfang von 110 KB.

Der Grund für die Bereitstellung dieses Datensatzes als Open Source liegt darin, dass der Effekt von R1 sehr stark ist und das kleine Modell, das auf den destillierten Daten von R1 SFT basiert, ebenfalls einen starken Effekt zeigt. Eine Suche ergab jedoch, dass es sich bei den meisten Open-Source-R1-destillierten Datensätzen um englische Datensätze handelt. Gleichzeitig zeigt der R1-Bericht, dass im Destillationsmodell auch einige allgemeine Szenario-Datensätze verwendet werden. Damit jeder die Wirkung des R1-Destillationsmodells besser reproduzieren kann, stellen wir den chinesischen Datensatz hiermit als Open Source zur Verfügung.

Die Datenverteilung in diesem chinesischen Datensatz ist wie folgt:

  • Mathematik: 36.987 Proben insgesamt,
  • Prüfung: 2.440 Proben insgesamt,
  • STEM: 12.000 Proben insgesamt,
  • Allgemein: Insgesamt 58.573, einschließlich Retarded Bar, Logical Reasoning, Xiaohongshu, Zhihu, Chat usw.

Feldbeschreibung:

  • Eingabe: Eingabe
  • reasoning_content: Denken
  • Inhalt: Ausgabe
  • repo_name: Datenquelle
Chinese-DeepSeek-R1-Distill-data-110k.torrent
Seeding 1Herunterladen 0Abgeschlossen 168Gesamtdownloads 451
  • Chinese-DeepSeek-R1-Distill-data-110k/
    • README.md
      1.74 KB
    • README.txt
      3.48 KB
      • data/
        • Chinese-DeepSeek-R1-Distill-110k.zip
          231.15 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Chinesische DeepSeek R1-Destillationsdaten. 110.000 Chinesische Daten Basierend Auf Dem DeepSeek-R1-Destillationsdatensatz | Datensätze | HyperAI