HyperAIHyperAI

Command Palette

Search for a command to run...

AM-DeepSeek-R1-Distilled-1.4M Großer Datensatz Für Allgemeine Denkaufgaben

Datum

vor 7 Monaten

Größe

47.22 GB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

AM-DeepSeek-R1-Distilled-1.4M ist ein umfangreicher Datensatz für allgemeine Denkaufgaben, der im März 2025 vom am-team veröffentlicht wurde. Die zugehörigen Ergebnisse sind:1,4 Millionen Open-Source-Datensätze zum destillierten Schlussfolgern ermöglichen das Training großer Sprachmodelle".

Der Datensatz enthält ungefähr 1,4 Millionen Dateneinträge und decken eine Vielzahl von Fragetypen ab, darunter Mathematik, Code, wissenschaftliche Fragen und Antworten und allgemeiner Chat. Diese Daten wurden sorgfältig ausgewählt, semantisch dedupliziert und streng bereinigt, um die hohe Qualität und Relevanz der Daten sicherzustellen. Jeder Eintrag im Datensatz enthält ausführliche Denkspuren, die dem Modell nicht nur Beispiele für den Denkprozess liefern, sondern dem Modell auch dabei helfen, komplexe Denkaufgaben besser zu verstehen und Lösungen dafür zu generieren. Die Veröffentlichung des AM-DeepSeek-R1-Distilled-1.4M-Datensatzes soll ein leistungsstarkes Tool für die Verarbeitung natürlicher Sprache und Schlussfolgerungsaufgaben bereitstellen, insbesondere für das Trainieren und Optimieren der Schlussfolgerungsfähigkeiten großer Sprachmodelle. Es kann Modellen dabei helfen, ihre Leistung in Schlüsselbereichen wie Mathematik, Code und Beantwortung wissenschaftlicher Fragen zu verbessern, sodass sie verschiedene komplexe Denkaufgaben besser bewältigen können.

AM-DeepSeek-R1-Distilled-1.4M.torrent
Seeding 1Herunterladen 0Abgeschlossen 71Gesamtdownloads 159
  • AM-DeepSeek-R1-Distilled-1.4M/
    • README.md
      1.8 KB
    • README.txt
      3.6 KB
      • data/
        • main.zip
          10.32 GB
          • main/
            • README.md
              10.32 GB
            • am_0.5M.jsonl
              23.84 GB
            • am_0.5M.jsonl.zst
              25.76 GB
            • am_0.9M.jsonl
              44.19 GB
            • am_0.9M.jsonl.zst
              47.19 GB
            • am_0.9M_sample_1k.jsonl
              47.21 GB
            • am_0.9M_sample_1k.jsonl.zst
              47.22 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
AM-DeepSeek-R1-Distilled-1.4M Großer Datensatz Für Allgemeine Denkaufgaben | Datensätze | HyperAI