HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Raisonnement Mathématique AceReason-1.1-SFT

Discuter sur Discord

Date

il y a 7 mois

Organisation

NVIDIA

URL du document

arxiv.org

AceReason-1.1-SFT est un jeu de données de réglage fin supervisé (SFT) diversifié et de haute qualité, publié par NVIDIA en 2025, axé sur le raisonnement mathématique et le raisonnement de code. Les résultats de l'article sont les suivants :AceReason-Nemotron 1.1 : Améliorer le raisonnement mathématique et le raisonnement par code grâce à la synergie SFT et RL", qui vise à former des modèles SFT axés sur le raisonnement mathématique et le raisonnement codé.

Cet ensemble de données sert de modèle de raisonnement mathématique et de code AceReason-Nemotron-1.1-7B Données de formation SFT de , toutes les réponses de l'ensemble de données sont générées par DeepSeek-R1.

L'ensemble de données AceReason-1.1-SFT contient 2 668 741 échantillons mathématiques et 1 301 591 échantillons de code, provenant d'OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, leetcode, TACO et d'applications. L'ensemble de données est nettoyé et les échantillons présentant un chevauchement de 9 grammes avec les échantillons de test des benchmarks mathématiques et de codage sont filtrés.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp