HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'échantillonnage Nemotron-Pretraining-Dataset-sample

Date

il y a 3 mois

Taille

79.87 MB

Organisation

NVIDIA

URL de l'article

2508.14444

Licence

Autre

Tags

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

Nemotron-Pretraining-Dataset-sample est une version d'échantillonnage simplifiée de l'ensemble de données de pré-entraînement Nemotron publié par NVIDIA en 2025. Les résultats de l'article associé sont «NVIDIA Nemotron Nano 2 : un modèle de raisonnement hybride Mamba-Transformer précis et efficace".

L'ensemble de données contient 10 sous-ensembles représentatifs sélectionnés parmi différents composants du corpus complet SFT et de pré-formation, couvrant des données de questions-réponses de haute qualité, du contenu extrait axé sur le domaine mathématique, des métadonnées de code et des données d'instructions de style SFT, adaptées à la révision et aux expériences rapides.

Nemotron-Pretraining-Dataset-sample.torrent
Partage 2Téléchargement 0Terminés 17Téléchargements totaux 91
  • Nemotron-Pretraining-Dataset-sample/
    • README.md
      1.37 KB
    • README.txt
      2.73 KB
      • data/
        • Nemotron-Pretraining-Dataset-sample.zip
          79.87 MB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données d'échantillonnage Nemotron-Pretraining-Dataset-sample | Ensembles de données | HyperAI