Ensemble De Données De Raisonnement Mathématique AceReason-1.1-SFT
Date
URL de publication
Catégories
AceReason-1.1-SFT est un jeu de données de réglage fin supervisé (SFT) diversifié et de haute qualité, publié par NVIDIA en 2025, axé sur le raisonnement mathématique et le raisonnement de code. Les résultats de l'article sont les suivants :AceReason-Nemotron 1.1 : Améliorer le raisonnement mathématique et le raisonnement par code grâce à la synergie SFT et RL", qui vise à former des modèles SFT axés sur le raisonnement mathématique et le raisonnement codé.
Cet ensemble de données sert de modèle de raisonnement mathématique et de code AceReason-Nemotron-1.1-7B Données de formation SFT de , toutes les réponses de l'ensemble de données sont générées par DeepSeek-R1.
L'ensemble de données AceReason-1.1-SFT contient 2 668 741 échantillons mathématiques et 1 301 591 échantillons de code, provenant d'OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, leetcode, TACO et d'applications. L'ensemble de données est nettoyé et les échantillons présentant un chevauchement de 9 grammes avec les échantillons de test des benchmarks mathématiques et de codage sont filtrés.