HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Post-Training-Dataset-v2 Post-Training-Datensatz

Date

vor 4 Monaten

Size

36.78 GB

Organization

NVIDIA

Paper URL

2508.14444

License

CC BY 4.0

Nemotron-Post-Training-Dataset-v2 ist eine von NVIDIA im Jahr 2025 veröffentlichte Version, die auf dem bestehenden Post-Training-Korpus basiert. Dieser Datensatz erweitert SFT- und RL-Daten auf fünf Zielsprachen (Spanisch/Französisch/Deutsch/Italienisch/Japanisch) und deckt Mathematik, Code, MINT (Mathematik, Informatik, Naturwissenschaften und Technik), Dialog und weitere Szenarien ab. Er dient der Verbesserung der Argumentations- und Anweisungsfolgefähigkeiten des Modells und bietet metadatenbasierte Filterfunktionen und typische Teilmengenbeispiele. Dieser Datensatz dient der Veröffentlichungs- und Ausrichtungsforschung der Nemotron-Nano-9B-v2-Reihe und ist eines ihrer öffentlichen Post-Training-Korpora, das es Nutzern erleichtert, Experimente zu reproduzieren und weiter zu verbessern. Die relevanten Ergebnisse der Studie sind „NVIDIA Nemotron Nano 2: Ein genaues und effizientes hybrides Mamba-Transformer-Reasoning-Modell".

Screenbare ProbenverteiltMit Metadaten:

  • Download filtern: Unterstützt schnelles Filtern und Herunterladen nach Metadaten wie Kategorie/Sprache/Quellmodell
  • Kategorie und Größe (Wert): Mathematik (239.467); Code (175.000); Stamm (355.000); Chat (627.720)
  • Mehrsprachige Abdeckung: ja, de, it, es, fr
  • Quelle: Synthetisiert aus mehreren großen Modellen (wie DeepSeek-R1-0528, Qwen 2.5/3-Serie usw.)
  • Anmerkungsformat: Einige Beispiele bieten zwei Antworten: „Argumentation an oder aus“; die Argumentationsspur ist in Englisch

Nemotron-Post-Training-Dataset-v2.torrent
Seeding 1Downloading 0Completed 31Total Downloads 117
  • Nemotron-Post-Training-Dataset-v2/
    • README.md
      1.94 KB
    • README.txt
      3.88 KB
      • data/
        • Nemotron-Post-Training-Dataset-v2.zip
          36.78 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp