HyperAIHyperAI

Ensemble De Données De Raisonnement Mathématique MathX-5M

Date

il y a 2 mois

URL de publication

huggingface.co

Licence

MIT

Aide au téléchargement

MathX est un ensemble de données de raisonnement mathématique conçu pour l'optimisation et le perfectionnement de modèles basés sur des instructions, afin d'améliorer les capacités de réflexion. Cet ensemble de données constitue le corpus public de données de raisonnement mathématique le plus vaste et le plus complet à ce jour.

L'ensemble de données comprend 5 millions d'exemples de raisonnement étape par étape soigneusement sélectionnés, chacun contenant : l'énoncé du problème, le raisonnement détaillé et la solution correcte vérifiée. Les exemples couvrent l'arithmétique et la théorie des nombres, l'algèbre et les mathématiques polynomiales, la géométrie et la trigonométrie, le calcul et l'analyse.

Distribution de la complexité des problèmes

  • Niveau de base (30%) : Concepts et opérations mathématiques de base
  • Intermédiaire (30%) : Problèmes à plusieurs étapes nécessitant des chaînes de raisonnement
  • Avancé (40%) : Défis et preuves mathématiques complexes

Caractéristiques du jeu de données :

  • Diversité : Couverture complète des mathématiques, de l'arithmétique de base au calcul avancé
  • Qualité : processus de sélection et de vérification en plusieurs étapes
  • Raisonnement : solutions étape par étape avec des idées mathématiques détaillées
  • Précision : Réponses vérifiées par apprentissage par renforcement et vérifiées pour leur exactitude
Ensemble De Données De Raisonnement Mathématique MathX-5M | Ensembles de données | HyperAI