HyperAIHyperAI

Command Palette

Search for a command to run...

Llama-Nemotron-Post-Training-Dataset Post-Training-Datensatz

Datum

vor 2 Monaten

Organisation

NVIDIA

Paper-URL

2505.00949

Lizenz

CC BY 4.0

Llama-Nemotron-Post-Training-Dataset ist ein umfangreicher Post-Training-Datensatz, der 2025 von NVIDIA als Open Source bereitgestellt wird. Die zugehörigen Ergebnisse des Papiers lauten:Llama-Nemotron: Effiziente Denkmodelle", dessen Ziel darin besteht, die Mathematik-, Code-, allgemeinen Argumentations- und Anweisungsfolgefähigkeiten der Modelle der Llama-Nemotron-Reihe in der Phase nach dem Training (wie SFT und RL) zu verbessern.

Dieser Datensatz kombiniert Daten aus den Phasen des überwachten Feintunings (SFT) und des bestärkenden Lernens (RL). Die aktuelle Version v1.1 (die im Vergleich zur vorherigen Version etwa 2,2 Millionen mathematische Beispiele und 500.000 Code-Reasoning-Beispiele hinzufügt) eignet sich für das Training von KI-Agenten, Chatbots, RAG-Systemen und anderen KI-gesteuerten Anwendungen.

Datenverteilung (nach Anzahl der Kategorieeinträge)

  • Mathematik: 22.066.397
  • Code: 10.108.883
  • Wissenschaft: 708.920
  • Anweisung folgt: 56.339
  • Chat: 39.792
  • Sicherheit: 31.426

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp