HyperAIHyperAI

Command Palette

Search for a command to run...

AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren

Datum

vor 4 Monaten

Organisation

NVIDIA

Paper-URL

arxiv.org

Treten Sie der Discord-Community bei

AceReason-1.1-SFT ist ein vielfältiger und hochwertiger Supervised Fine-Tuning-Datensatz (SFT), der 2025 von NVIDIA veröffentlicht wurde und sich auf mathematisches Denken und Code-Reasoning konzentriert. Die zugehörigen Ergebnisse sind:AceReason-Nemotron 1.1: Fortschrittliche Mathematik und Code-Reasoning durch SFT- und RL-Synergie“, dessen Ziel es ist, SFT-Modelle zu trainieren, die sich auf mathematisches Denken und Code-Argumentation konzentrieren.

Dieser Datensatz dient als mathematisches und Code-Argumentationsmodell AceReason-Nemotron-1.1-7B SFT-Trainingsdaten von , alle Antworten im Datensatz werden von DeepSeek-R1 generiert.

Der AceReason-1.1-SFT-Datensatz enthält 2.668.741 mathematische Beispiele und 1.301.591 Codebeispiele und deckt Daten von OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, Leetcode, TACO und Apps ab. Der Datensatz wurde bereinigt und Beispiele mit 9-Gramm-Überlappung mit Testbeispielen in Mathematik- und Code-Benchmarks werden herausgefiltert.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren | Datensätze | HyperAI