Ensemble De Données De Formation AceMath Instruct Sur Le Raisonnement Mathématique
Date
Taille
URL de publication
Catégories
AceMath Instruct Training Data est un ensemble de données publié par NVIDIA en 2025 pour la formation des modèles AceMath, visant à améliorer les performances du modèle dans les tâches de raisonnement mathématique. Les résultats de l'article connexe sont «AceMath : Améliorer le raisonnement mathématique de pointe grâce à la post-formation et à la modélisation des récompenses".
Cet ensemble de données contient plusieurs étapes de réglage fin des données. general_sft_stage1
Contient 2 261 687 échantillons, couvrant principalement des échantillons de réglage fin d'instructions dans les domaines du code et des mathématiques ; general_sft_stage2
Contient 1 634 573 échantillons, étendus au code, aux mathématiques et au réglage fin des instructions du domaine général ; et spécifiquement pour le domaine des mathématiques math_sft
Il contient 1 661 094 échantillons et se concentre sur l’amélioration des compétences de raisonnement mathématique. La génération de ces données combine les modèles Qwen2.5-Math-72B-Instruct et GPT-4o-mini pour garantir la diversité et la haute qualité des données.