HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Pretraining-Dataset-Beispiel-Sampling-Dataset

Date

vor 5 Monaten

Size

79.87 MB

Organization

NVIDIA

Paper URL

2508.14444

License

Other

Tags

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Nemotron-Pretraining-Dataset-sample ist eine optimierte Sampling-Version des Nemotron-Pretraining-Datasets, das 2025 von NVIDIA veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:NVIDIA Nemotron Nano 2: Ein genaues und effizientes hybrides Mamba-Transformer-Reasoning-Modell".

Der Datensatz enthält 10 repräsentative Teilmengen, die aus verschiedenen Komponenten des vollständigen SFT- und Vortrainingskorpus ausgewählt wurden. Er umfasst hochwertige Frage-Antwort-Daten, extrahierte Inhalte mit Schwerpunkt auf dem mathematischen Bereich, Code-Metadaten und Anweisungsdaten im SFT-Stil, die sich für die Überprüfung und schnelle Experimente eignen.

Nemotron-Pretraining-Dataset-sample.torrent
Seeding 1Downloading 0Completed 29Total Downloads 115
  • Nemotron-Pretraining-Dataset-sample/
    • README.md
      1.37 KB
    • README.txt
      2.73 KB
      • data/
        • Nemotron-Pretraining-Dataset-sample.zip
          79.87 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp