Ensemble De Données De Raisonnement Mathématique OpenMathReasoning
Date
URL de publication
Catégories
L'ensemble de données OpenMathReasoning est le premier ensemble de données à grande échelle et de haute qualité au monde axé sur le raisonnement mathématique, publié par NVIDIA en 2025. Les résultats pertinents de l'article sont les suivants :Solution gagnante AIMO-2 : création de modèles de raisonnement mathématique de pointe avec le jeu de données OpenMathReasoning", qui vise à aider la série de modèles OpenMath-Nemotron à obtenir des résultats exceptionnels dans le domaine du raisonnement mathématique.
L'ensemble de données contient des annotations détaillées multidimensionnelles, notamment des étiquettes de type de problème mathématique, des étapes détaillées de résolution de problème et une classification du niveau de difficulté du problème. Ces données de haute qualité, issues du domaine professionnel des mathématiques et des communautés en ligne, fournissent un support solide et puissant pour une recherche approfondie sur les processus de raisonnement mathématique et l'optimisation des modèles de résolution de problèmes mathématiques, et favorisent le développement vigoureux d'industries connexes telles que les systèmes de tutorat intelligent en mathématiques, les outils auxiliaires de compétition en mathématiques et l'automatisation du calcul de recherche scientifique.
L'ensemble de données contient :
- 540 000 problèmes mathématiques uniques du forum AoPS,
- Solution de 3,2 millions de stratégies de confiance à long terme (CoT)
- Solution de raisonnement intégré à l'outil (TIR) de 1,7 m de long
- 566 000 échantillons pour sélectionner les solutions les plus prometteuses parmi de nombreux candidats (GenSelect)