Command Palette
Search for a command to run...
Nemotron-Pretraining-Dataset-Beispiel-Sampling-Dataset
* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.
Nemotron-Pretraining-Dataset-sample ist eine optimierte Sampling-Version des Nemotron-Pretraining-Datasets, das 2025 von NVIDIA veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten:NVIDIA Nemotron Nano 2: Ein genaues und effizientes hybrides Mamba-Transformer-Reasoning-Modell".
Der Datensatz enthält 10 repräsentative Teilmengen, die aus verschiedenen Komponenten des vollständigen SFT- und Vortrainingskorpus ausgewählt wurden. Er umfasst hochwertige Frage-Antwort-Daten, extrahierte Inhalte mit Schwerpunkt auf dem mathematischen Bereich, Code-Metadaten und Anweisungsdaten im SFT-Stil, die sich für die Überprüfung und schnelle Experimente eignen.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.