HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Raisonnement Mathématique AceReason-1.1-SFT

Discuss on Discord

Date

il y a 6 mois

Organization

NVIDIA

Paper URL

arxiv.org

AceReason-1.1-SFT est un jeu de données de réglage fin supervisé (SFT) diversifié et de haute qualité, publié par NVIDIA en 2025, axé sur le raisonnement mathématique et le raisonnement de code. Les résultats de l'article sont les suivants :AceReason-Nemotron 1.1 : Améliorer le raisonnement mathématique et le raisonnement par code grâce à la synergie SFT et RL", qui vise à former des modèles SFT axés sur le raisonnement mathématique et le raisonnement codé.

Cet ensemble de données sert de modèle de raisonnement mathématique et de code AceReason-Nemotron-1.1-7B Données de formation SFT de , toutes les réponses de l'ensemble de données sont générées par DeepSeek-R1.

L'ensemble de données AceReason-1.1-SFT contient 2 668 741 échantillons mathématiques et 1 301 591 échantillons de code, provenant d'OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, leetcode, TACO et d'applications. L'ensemble de données est nettoyé et les échantillons présentant un chevauchement de 9 grammes avec les échantillons de test des benchmarks mathématiques et de codage sont filtrés.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp