Command Palette
Search for a command to run...
Une Collection De 7 Principaux Ensembles De Données De Raisonnement Mathématique, Couvrant Le Raisonnement arithmétique/la Logique symbolique/les Mathématiques visuelles/l'analyse Géométrique

Grâce aux progrès rapides des capacités de modélisation à grande échelle, le raisonnement mathématique, autrefois une activité intellectuelle exclusivement humaine, devient l'un des défis les plus importants de l'intelligence artificielle. Des tâches qui reposaient autrefois sur la rationalité humaine, comme la déduction logique, le calcul de formules et la pensée multi-étapes, sont désormais progressivement « comprises » et « apprises » par les machines.Cependant, contrairement à la compréhension du langage ou à la reconnaissance d’images, le raisonnement mathématique exige que le modèle comprenne non seulement le sens superficiel de la question, mais aussi qu’il ait un aperçu de la structure logique qui la sous-tend, ce qui rend les performances du modèle particulièrement dépendantes de la qualité des données.
Le passage des modèles du « calcul » au « raisonnement » nécessite l'appui de données de haute qualité, structurées et logiquement cohérentes. Un ensemble de données systématique, hiérarchique et logiquement cohérent détermine non seulement la capacité d'un modèle à saisir les principes de raisonnement qui sous-tendent les symboles abstraits, mais influence également sa capacité à généraliser et à s'autocorriger dans des environnements ouverts.Par rapport aux corpus généraux de langage naturel, les ensembles de données de raisonnement mathématique mettent davantage l'accent sur la diversité de la distribution des problèmes, l'explicabilité des chemins de résolution de problèmes et l'annotation complète des chaînes de raisonnement, garantissant que le processus d'apprentissage du modèle est aussi proche que possible de la pensée humaine.
Dans l'ensemble,Le raisonnement mathématique devient une fenêtre clé pour l’intelligence artificielle pour évoluer vers une « intelligence explicable ».Afin de promouvoir la recherche et l'application dans ce domaine, HyperAI a compilé une série d'ensembles de données de raisonnement mathématique provenant d'institutions et d'entreprises de premier plan dans le monde entier, notamment l'Université du Zhejiang, l'Université de Hong Kong, NVIDIA, OpenAI et Alibaba, couvrant plusieurs domaines, notamment les mathématiques visuelles et l'analyse géométrique.
Cliquez pour voir plus d'ensembles de données open source :
Résumé de l'ensemble de données de raisonnement mathématique
1. Ensemble de données de référence We-Math2.0-Standard
Taille estimée :369,86 Mo
Adresse de téléchargement :https://go.hyper.ai/1dAZ2
We-Math2.0-Standard est un ensemble de données standard pour le raisonnement mathématique visuel, publié en 2025 par l'Université des Postes et Télécommunications de Pékin, Tencent et l'Université Tsinghua. L'article correspondant s'intitule « WE-MATH 2.0 : Un système de manuels de mathématiques polyvalent pour encourager le raisonnement mathématique visuel ». Il vise à fournir une base d'évaluation diagnostique, explicable et comparable.
Adresse du document :
https://hyper.ai/en/papers/2508.10433
Cet ensemble de données construit un espace d'étiquetage unifié autour de 1 819 principes de connaissance précisément définis, annotant explicitement chaque question avec le principe et le sélectionnant rigoureusement. Il permet ainsi une couverture globale large et équilibrée, renforçant notamment les sous-domaines mathématiques et les types de questions jusque-là sous-représentés. L'ensemble de données adopte une conception à double expansion :
* Premièrement, plusieurs images par question sont utilisées pour tester l’intégration et l’alignement des preuves visuelles multi-sources ;
* Deuxièmement, des questions multiples par image sont utilisées pour tester le transfert de principes multiples et la flexibilité conceptuelle dans le même contexte visuel.
Chaque exemple se compose d'une image et d'une amorce de texte, et est accompagné d'annotations des principes de connaissance et des réponses standard sur lesquels s'appuie la question.
2. Ensemble de données de problèmes mathématiques NuminaMath-LEAN
Taille estimée :65,06 Mo
Adresse de téléchargement :https://go.hyper.ai/BfJFv
NuminaMath-LEAN est un jeu de données de problèmes mathématiques publié conjointement par Numina et l'équipe Kimi en 2025. L'article associé est intitulé « Aperçu de Kimina-Prover : Vers de grands modèles de raisonnement formel avec apprentissage par renforcement ». Il vise à fournir des énoncés et des preuves formelles annotés manuellement pour l'entraînement et l'évaluation de modèles automatisés de démonstration de théorèmes.
Adresse du document :
https://hyper.ai/en/papers/2504.11354
Cet ensemble de données contient 100 000 problèmes de compétitions mathématiques, dont ceux issus de compétitions de référence telles que l'Olympiade internationale de mathématiques (IMO) et l'Olympiade américaine de mathématiques (USAMO). Les types de données incluent les énoncés de problèmes, les classifications des types de questions, les réponses, les sources, les preuves formelles, les informations des annotateurs et les enregistrements des processus d'apprentissage par renforcement.
3. Ensemble de données SFT russe T-Wix
Taille estimée :1,43 Go
Adresse de téléchargement :https://go.hyper.ai/5XULu
T-Wix est un jeu de données SFT russe. L'article associé, « De la quantité à la qualité : optimiser les performances du LLM grâce à la sélection de données autoguidée pour le réglage des instructions », vise à améliorer les capacités du modèle, de la résolution de problèmes algorithmiques et mathématiques au dialogue, à la pensée logique et aux schémas de raisonnement.
Adresse du document :
https://arxiv.org/abs/2308.12032
L'ensemble de données contient 499 598 échantillons de langue russe, dont 468 614 échantillons généraux couvrant divers domaines tels que les mathématiques, les sciences, la programmation, la culture générale, le suivi d'instructions et les jeux de rôle. Les échantillons de raisonnement contiennent 30 984 points de données, axés sur des problèmes mathématiques et scientifiques avancés et fournissant des traces de raisonnement détaillées.
4. Ensemble de données de raisonnement mathématique Nemotron-Math-HumanReasoning
Taille estimée :639,91 Ko
Adresse de téléchargement :https://go.hyper.ai/28kjP
Nemotron-Math-HumanReasoning est un ensemble de données de raisonnement mathématique publié par NVIDIA en 2025. Le résultat de l'article associé est « Le défi de l'enseignement du raisonnement aux LLM sans RL ni distillation », qui vise à simuler le style de raisonnement étendu de modèles tels que DeepSeek-R1.
Adresse du document :
https://arxiv.org/abs/2507.09850
L'ensemble de données contient 50 problèmes mathématiques de l'ensemble de données OpenMathReasoning, 200 solutions écrites par l'homme et 50 solutions supplémentaires générées par QwQ-32B-Preview.
5. Ensemble de données Open-Omega-Atom-1,5M
Taille estimée :6,6 Go
Adresse de téléchargement :https://go.hyper.ai/bndWW
Open-Omega-Atom-1.5M est un ensemble de données de raisonnement mathématique et scientifique conçu pour améliorer les capacités de raisonnement en mathématiques et en sciences.
L'ensemble de données contient environ 1,5 million de données et est conçu pour les applications mathématiques, scientifiques et de code, les données mathématiques représentant une partie importante de sa composition.
Caractéristiques du jeu de données :
* Concis et de haute qualité : concentrez-vous sur des problèmes clairs et stimulants et des solutions étape par étape.
* Focus STEM : intègre les mathématiques, le raisonnement codé et la pensée scientifique avec une spécialisation en mathématiques.
* Organisées et optimisées : les données proviennent de manière sélective d'ensembles de données ouverts de haute qualité et de données personnalisées pour obtenir une diversité et une cohérence optimales.
* Adapté au raisonnement : offre une couverture solide de la résolution de problèmes par étapes et par logique, et peut servir de référence pour les moteurs de raisonnement.
6. Ensemble de données de raisonnement mathématique GSM8K
Taille estimée :4,92 Mo
Adresse de téléchargement :https://go.hyper.ai/d9PZh
GSM8K est un ensemble de données de raisonnement mathématique publié par OpenAI en 2022. Les résultats de l'article associé sont : « Training Verifiers to Solve Math Word Problems », qui vise à améliorer les performances des modèles d'apprentissage automatique dans la compréhension et la résolution de problèmes mathématiques complexes.
Adresse du document :
https://arxiv.org/abs/2110.14168
Cet ensemble de données contient 8 500 problèmes mathématiques élémentaires de haute qualité, rédigés en diverses langues, couvrant l'algèbre, l'arithmétique, la géométrie et d'autres domaines. La résolution du problème comporte de 2 à 8 étapes. La solution consiste principalement en une série de calculs simples utilisant des opérations arithmétiques de base (+ − × ÷) pour obtenir la réponse finale.
7. Ensemble de données de référence de raisonnement mathématique VCBench
Taille estimée :86,04 Mo
Adresse de téléchargement :https://hyper.ai/cn/datasets/43960
VCBench est un ensemble de données de référence pour l'évaluation du raisonnement mathématique multimodal avec des dépendances visuelles explicites, publié par Alibaba et l'Université du Zhejiang en 2025. L'ensemble de données contient 1 720 paires questions-réponses et un total de 6 697 images.
Les questions portent principalement sur les 6 domaines suivants :
* Heure et calendrier : teste des questions de raisonnement temporel dans deux sous-catégories (calendrier et horloge), nécessitant une compréhension des intervalles de temps et des calculs basés sur le calendrier.
* Espace et position : les défis se concentrent sur le raisonnement spatial dans trois sous-catégories (direction, position et lieu) pour évaluer la compréhension de la position relative, de la direction et des relations spatiales.
* Géométrie et formes : les questions couvrant cinq sous-catégories (angles, quadrilatères, rectangles, formes et triangles) testent la compréhension géométrique de base, de la reconnaissance des formes de base à l'analyse des propriétés plus complexe.
* Objets et mouvement : les tâches dans deux sous-catégories (Cube et Déplacement) évaluent la compréhension des objets tridimensionnels et des transformations de mouvement.
* Raisonnement et observation : les questions des deux sous-catégories (inférence et observation) sont conçues pour tester le raisonnement logique et les compétences d'observation visuelle minutieuse.
* Organisation et modèles : les défis répartis dans trois sous-catégories (organisation, modèles et pondération) évaluent la reconnaissance des modèles, le séquençage et la logique organisationnelle.
Voici un résumé des jeux de données recommandés dans ce numéro. Téléchargez-les en un clic !