Date

il y a 10 mois

Taille

36.78 GB

Organisation

URL du document

2508.14444

Licence

CC BY 4.0

Balises

Le jeu de données Nemotron-Post-Training-v2 est une version lancée par NVIDIA en 2025, basée sur le corpus post-entraînement existant. Ce jeu de données étend les données SFT et RL à cinq langues cibles (espagnol, français, allemand, italien et japonais), couvrant les mathématiques, le code, les STEM (sciences, technologie, ingénierie et mathématiques), le dialogue et d'autres scénarios. Il permet d'améliorer les capacités de raisonnement et de suivi des instructions du modèle. Il fournit également des fonctions de filtrage basées sur les métadonnées et des exemples de sous-ensembles typiques. Ce jeu de données sert à la recherche sur la diffusion et l'alignement de la série Nemotron-Nano-9B-v2 et constitue l'un de ses corpus post-entraînement publics, facilitant ainsi la reproduction et l'amélioration des expériences. Les résultats de l'article sont les suivants :NVIDIA Nemotron Nano 2 : un modèle de raisonnement hybride Mamba-Transformer précis et efficace". Échantillons criblablesdistribuéAvec des métadonnées:

Téléchargement de filtre : prend en charge le filtrage et le téléchargement rapides par métadonnées telles que la catégorie/la langue/le modèle source
Catégorie et taille (valeur) : math (239 467) ; code (175 000) ; stem (355 000) ; chat (627 720)
Couverture multilingue : ja, de, it, es, fr
Source : Synthétisé à partir de plusieurs grands modèles (tels que DeepSeek-R1-0528, série Qwen 2.5/3, etc.)
Format d'annotation : Certains échantillons fournissent deux réponses : « raisonnement activé ou désactivé » ; la trace du raisonnement est en anglais

Nemotron-Post-Training-Dataset-v2.torrent

Seeding 2Téléchargement 0Terminé 49Total Downloads 143

Nemotron-Post-Training-Dataset-v2/
- README.md
  1.94 KB
- README.txt
  3.88 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

il y a 2 mois

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

il y a 5 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a 2 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 5 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 10 mois

Taille

36.78 GB

Organisation

URL du document

2508.14444

Licence

CC BY 4.0

Balises

Téléchargement de filtre : prend en charge le filtrage et le téléchargement rapides par métadonnées telles que la catégorie/la langue/le modèle source
Catégorie et taille (valeur) : math (239 467) ; code (175 000) ; stem (355 000) ; chat (627 720)
Couverture multilingue : ja, de, it, es, fr
Source : Synthétisé à partir de plusieurs grands modèles (tels que DeepSeek-R1-0528, série Qwen 2.5/3, etc.)
Format d'annotation : Certains échantillons fournissent deux réponses : « raisonnement activé ou désactivé » ; la trace du raisonnement est en anglais

Nemotron-Post-Training-Dataset-v2.torrent

Seeding 2Téléchargement 0Terminé 49Total Downloads 143

Nemotron-Post-Training-Dataset-v2/
- README.md
  1.94 KB
- README.txt
  3.88 KB

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

il y a 2 mois

zh-meme-sft-8k Ensemble De Données Sur La Culture Des Mèmes Internet Chinois

il y a 3 mois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

il y a 4 mois

Ensemble De Données Du Problème d'inférence Open-RL

il y a 4 mois

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

il y a 5 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a 2 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 5 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données post-formation Nemotron-Post-Training-Dataset-v2 Ensemble De Données post-formation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données post-formation Nemotron-Post-Training-Dataset-v2 Ensemble De Données post-formation

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

zh-meme-sft-8k Ensemble De Données Sur La Culture Des Mèmes Internet Chinois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données post-formation Nemotron-Post-Training-Dataset-v2 Ensemble De Données post-formation

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

zh-meme-sft-8k Ensemble De Données Sur La Culture Des Mèmes Internet Chinois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

zh-meme-sft-8k Ensemble De Données Sur La Culture Des Mèmes Internet Chinois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'inférence Multitâche TxT360-3efforts

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

zh-meme-sft-8k Ensemble De Données Sur La Culture Des Mèmes Internet Chinois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données Du Problème d'inférence Open-RL

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données d'inférence Multitâche TxT360-3efforts