HyperAI

AM-DeepSeek-R1-Distilled-1.4M Großer Datensatz Für Allgemeine Denkaufgaben

Datum

vor 2 Monaten

Größe

47.22 GB

Organisation

Veröffentlichungs-URL

github.com

AM-DeepSeek-R1-Distilled-1.4M ist ein umfangreicher Datensatz für allgemeine Denkaufgaben, der im März 2025 vom am-team veröffentlicht wurde. Die zugehörigen Ergebnisse sind:1,4 Millionen Open-Source-Datensätze zum destillierten Schlussfolgern ermöglichen das Training großer Sprachmodelle".

Der Datensatz enthält ungefähr 1,4 Millionen Dateneinträge und decken eine Vielzahl von Fragetypen ab, darunter Mathematik, Code, wissenschaftliche Fragen und Antworten und allgemeiner Chat. Diese Daten wurden sorgfältig ausgewählt, semantisch dedupliziert und streng bereinigt, um die hohe Qualität und Relevanz der Daten sicherzustellen. Jeder Eintrag im Datensatz enthält ausführliche Denkspuren, die dem Modell nicht nur Beispiele für den Denkprozess liefern, sondern dem Modell auch dabei helfen, komplexe Denkaufgaben besser zu verstehen und Lösungen dafür zu generieren. Die Veröffentlichung des AM-DeepSeek-R1-Distilled-1.4M-Datensatzes soll ein leistungsstarkes Tool für die Verarbeitung natürlicher Sprache und Schlussfolgerungsaufgaben bereitstellen, insbesondere für das Trainieren und Optimieren der Schlussfolgerungsfähigkeiten großer Sprachmodelle. Es kann Modellen dabei helfen, ihre Leistung in Schlüsselbereichen wie Mathematik, Code und Beantwortung wissenschaftlicher Fragen zu verbessern, sodass sie verschiedene komplexe Denkaufgaben besser bewältigen können.

AM-DeepSeek-R1-Distilled-1.4M.torrent
Seeding 2Herunterladen 0Abgeschlossen 0Gesamtdownloads 2
  • AM-DeepSeek-R1-Distilled-1.4M/
    • README.md
      1.8 KB
    • README.txt
      3.6 KB
      • data/
        • main.zip
          10.32 GB
          • main/
            • README.md
              10.32 GB
            • am_0.5M.jsonl
              23.84 GB
            • am_0.5M.jsonl.zst
              25.76 GB
            • am_0.9M.jsonl
              44.19 GB
            • am_0.9M.jsonl.zst
              47.19 GB
            • am_0.9M_sample_1k.jsonl
              47.21 GB
            • am_0.9M_sample_1k.jsonl.zst
              47.22 GB