HyperAI

Ensemble De Données De Raisonnement Mathématique DeepMath-103K

Date

il y a 15 jours

Organisation

Université Jiao Tong de Shanghai

URL de publication

huggingface.co

Aide au téléchargement

DeepMath-103K est un ensemble de données à grande échelle pour la formation et l'évaluation de modèles de raisonnement mathématique publié conjointement par Tencent et l'Université Jiao Tong de Shanghai en 2025. Les résultats de l'article associé sont «DeepMath-103K : un ensemble de données mathématiques à grande échelle, stimulant, décontaminé et vérifiable pour faire progresser le raisonnement".

L'ensemble de données se concentre sur les problèmes mathématiques des niveaux 5 à 9, couvrant l'algèbre, le calcul, la théorie des nombres, la géométrie, les probabilités, les mathématiques discrètes et d'autres domaines, et se concentre sur les capacités de raisonnement complexes stimulantes. L'ensemble de données effectue également un traitement de décontamination détaillé pour les repères communs via la correspondance sémantique afin de minimiser les fuites de l'ensemble de tests et de promouvoir une évaluation équitable du modèle.

Classification hiérarchique des sujets mathématiques couverts par DeepMath-103K