HyperAIHyperAI

Command Palette

Search for a command to run...

AM-DeepSeek-R1-Distilled-1.4M Großer Datensatz Für Allgemeine Denkaufgaben

Date

vor 9 Monaten

Size

47.22 GB

Organization

Publish URL

github.com

Paper URL

arxiv.org

AM-DeepSeek-R1-Distilled-1.4M ist ein umfangreicher Datensatz für allgemeine Denkaufgaben, der im März 2025 vom am-team veröffentlicht wurde. Die zugehörigen Ergebnisse sind:1,4 Millionen Open-Source-Datensätze zum destillierten Schlussfolgern ermöglichen das Training großer Sprachmodelle".

Der Datensatz enthält ungefähr 1,4 Millionen Dateneinträge und decken eine Vielzahl von Fragetypen ab, darunter Mathematik, Code, wissenschaftliche Fragen und Antworten und allgemeiner Chat. Diese Daten wurden sorgfältig ausgewählt, semantisch dedupliziert und streng bereinigt, um die hohe Qualität und Relevanz der Daten sicherzustellen. Jeder Eintrag im Datensatz enthält ausführliche Denkspuren, die dem Modell nicht nur Beispiele für den Denkprozess liefern, sondern dem Modell auch dabei helfen, komplexe Denkaufgaben besser zu verstehen und Lösungen dafür zu generieren. Die Veröffentlichung des AM-DeepSeek-R1-Distilled-1.4M-Datensatzes soll ein leistungsstarkes Tool für die Verarbeitung natürlicher Sprache und Schlussfolgerungsaufgaben bereitstellen, insbesondere für das Trainieren und Optimieren der Schlussfolgerungsfähigkeiten großer Sprachmodelle. Es kann Modellen dabei helfen, ihre Leistung in Schlüsselbereichen wie Mathematik, Code und Beantwortung wissenschaftlicher Fragen zu verbessern, sodass sie verschiedene komplexe Denkaufgaben besser bewältigen können.

AM-DeepSeek-R1-Distilled-1.4M.torrent
Seeding 1Downloading 0Completed 79Total Downloads 201
  • AM-DeepSeek-R1-Distilled-1.4M/
    • README.md
      1.8 KB
    • README.txt
      3.6 KB
      • data/
        • main.zip
          10.32 GB
          • main/
            • README.md
              10.32 GB
            • am_0.5M.jsonl
              23.84 GB
            • am_0.5M.jsonl.zst
              25.76 GB
            • am_0.9M.jsonl
              44.19 GB
            • am_0.9M.jsonl.zst
              47.19 GB
            • am_0.9M_sample_1k.jsonl
              47.21 GB
            • am_0.9M_sample_1k.jsonl.zst
              47.22 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp