HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'échantillonnage Nemotron-Pretraining-Dataset-sample

Date

il y a 5 mois

Size

79.87 MB

Organization

NVIDIA

Paper URL

2508.14444

License

Other

Tags

* Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.

Nemotron-Pretraining-Dataset-sample est une version d'échantillonnage simplifiée de l'ensemble de données de pré-entraînement Nemotron publié par NVIDIA en 2025. Les résultats de l'article associé sont «NVIDIA Nemotron Nano 2 : un modèle de raisonnement hybride Mamba-Transformer précis et efficace".

L'ensemble de données contient 10 sous-ensembles représentatifs sélectionnés parmi différents composants du corpus complet SFT et de pré-formation, couvrant des données de questions-réponses de haute qualité, du contenu extrait axé sur le domaine mathématique, des métadonnées de code et des données d'instructions de style SFT, adaptées à la révision et aux expériences rapides.

Nemotron-Pretraining-Dataset-sample.torrent
Seeding 1Downloading 0Completed 29Total Downloads 115
  • Nemotron-Pretraining-Dataset-sample/
    • README.md
      1.37 KB
    • README.txt
      2.73 KB
      • data/
        • Nemotron-Pretraining-Dataset-sample.zip
          79.87 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp