Command Palette
Search for a command to run...
Ensemble De Données d'inférence Mathématique Nemotron-Math-v2
Date
URL du document
Licence
CC BY-SA 4.0
Balises
Nemotron-Math-v2 est un jeu de données d'inférence mathématique publié par NVIDIA Corporation en 2025. Parmi les articles de recherche associés, on peut citer… Nemotron-Math : Distillation efficace du raisonnement mathématique à long contexte à partir d'une supervision multimodale Il est principalement utilisé pour former les LLM à effectuer un raisonnement mathématique structuré, pour étudier les différences entre le raisonnement assisté par outils et le raisonnement en langage pur, et pour construire des systèmes de raisonnement à contexte long ou à voies multiples.
Cet ensemble de données contient environ 347 000 problèmes mathématiques de haute qualité et 7 millions de trajectoires d'inférence générées par des modèles. Chaque problème est résolu selon six configurations : profondeur d'inférence élevée, moyenne et faible, avec ou sans Python TIR. Les réponses sont validées par un pipeline utilisant un LLM comme arbitre.
Champs de données:
- Problème : Énoncés de problèmes extraits de sources telles que OpenMathReasoning et MathStackExchange.
- Messages : Journal de conversation de l'utilisateur et de son assistant, utilisé pour la formation LLM.
- expected_answer : La réponse extraite ou la réponse ayant obtenu le vote majoritaire généré par le modèle.
- Métadonnées : Taux de réussite selon différents scénarios de raisonnement et d'utilisation des outils
- data_source : La source de données est AoPS ou StackExchange-Math
- outil : définition de l’outil utilisé, ou vide.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.