HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Raisonnement Mathématique AceReason-1.1-SFT

Rejoignez la communauté Discord

AceReason-1.1-SFT est un jeu de données de réglage fin supervisé (SFT) diversifié et de haute qualité, publié par NVIDIA en 2025, axé sur le raisonnement mathématique et le raisonnement de code. Les résultats de l'article sont les suivants :AceReason-Nemotron 1.1 : Améliorer le raisonnement mathématique et le raisonnement par code grâce à la synergie SFT et RL", qui vise à former des modèles SFT axés sur le raisonnement mathématique et le raisonnement codé.

Cet ensemble de données sert de modèle de raisonnement mathématique et de code AceReason-Nemotron-1.1-7B Données de formation SFT de , toutes les réponses de l'ensemble de données sont générées par DeepSeek-R1.

L'ensemble de données AceReason-1.1-SFT contient 2 668 741 échantillons mathématiques et 1 301 591 échantillons de code, provenant d'OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, leetcode, TACO et d'applications. L'ensemble de données est nettoyé et les échantillons présentant un chevauchement de 9 grammes avec les échantillons de test des benchmarks mathématiques et de codage sont filtrés.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données De Raisonnement Mathématique AceReason-1.1-SFT | Ensembles de données | HyperAI