Command Palette
Search for a command to run...
Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique
Date
URL du document
Licence
CC BY 4.0
Nemotron-SFT-Math-v4 est un ensemble de données d'inférence mathématique publié par NVIDIA en mai 2026. Les articles de recherche associés sont les suivants : Nemotron-Math : Distillation efficace du raisonnement mathématique à long contexte à partir d'une supervision multimodaleCe système vise à résoudre les problèmes liés à la qualité inégale des jeux de données mathématiques traditionnels, aux trajectoires de raisonnement non standardisées, à la faible précision et au nombre limité de scénarios. Il améliore efficacement le raisonnement structuré, le raisonnement multi-trajectoires et les capacités de vérification des réponses du modèle. Il est largement utilisé pour l'optimisation de modèles de raisonnement mathématique à grande échelle, l'analyse des trajectoires de raisonnement, le développement d'algorithmes de vérification des réponses, la construction de systèmes de raisonnement à contexte long et l'évaluation de la robustesse du raisonnement des modèles. Cet ensemble de données contient 545 431 exemples d'entraînement, dont 285 516 exemples de raisonnement COT et 259 915 exemples de raisonnement TIR. Il couvre des scénarios mathématiques issus de compétitions et de recherches universitaires en algèbre, géométrie, théorie des nombres, combinatoire, etc. Les données sont annotées à l'aide d'une méthode hybride manuelle et automatisée et comprennent des champs standardisés tels qu'un numéro unique, le texte de la question, le dialogue à plusieurs tours, la réponse standard, la source et le protocole.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.