Command Palette
Search for a command to run...
Ensemble De Données d'inférence Mathématique Nemotron-Math-v2
Nemotron-Math-v2 est un jeu de données d'inférence mathématique publié par NVIDIA Corporation en 2025. Parmi les articles de recherche associés, on peut citer… Nemotron-Math : Distillation efficace du raisonnement mathématique à long contexte à partir d'une supervision multimodale Il est principalement utilisé pour former les LLM à effectuer un raisonnement mathématique structuré, pour étudier les différences entre le raisonnement assisté par outils et le raisonnement en langage pur, et pour construire des systèmes de raisonnement à contexte long ou à voies multiples.
Cet ensemble de données contient environ 347 000 problèmes mathématiques de haute qualité et 7 millions de trajectoires d'inférence générées par des modèles. Chaque problème est résolu selon six configurations : profondeur d'inférence élevée, moyenne et faible, avec ou sans Python TIR. Les réponses sont validées par un pipeline utilisant un LLM comme arbitre.
Champs de données:
- Problème : Énoncés de problèmes extraits de sources telles que OpenMathReasoning et MathStackExchange.
- Messages : Journal de conversation de l'utilisateur et de son assistant, utilisé pour la formation LLM.
- expected_answer : La réponse extraite ou la réponse ayant obtenu le vote majoritaire généré par le modèle.
- Métadonnées : Taux de réussite selon différents scénarios de raisonnement et d'utilisation des outils
- data_source : La source de données est AoPS ou StackExchange-Math
- outil : définition de l’outil utilisé, ou vide.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.