HyperAIHyperAI

Command Palette

Search for a command to run...

AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren

Auf Discord diskutieren

Datum

vor 7 Monaten

Organisation

NVIDIA

Paper-URL

arxiv.org

AceReason-1.1-SFT ist ein vielfältiger und hochwertiger Supervised Fine-Tuning-Datensatz (SFT), der 2025 von NVIDIA veröffentlicht wurde und sich auf mathematisches Denken und Code-Reasoning konzentriert. Die zugehörigen Ergebnisse sind:AceReason-Nemotron 1.1: Fortschrittliche Mathematik und Code-Reasoning durch SFT- und RL-Synergie“, dessen Ziel es ist, SFT-Modelle zu trainieren, die sich auf mathematisches Denken und Code-Argumentation konzentrieren.

Dieser Datensatz dient als mathematisches und Code-Argumentationsmodell AceReason-Nemotron-1.1-7B SFT-Trainingsdaten von , alle Antworten im Datensatz werden von DeepSeek-R1 generiert.

Der AceReason-1.1-SFT-Datensatz enthält 2.668.741 mathematische Beispiele und 1.301.591 Codebeispiele und deckt Daten von OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, Leetcode, TACO und Apps ab. Der Datensatz wurde bereinigt und Beispiele mit 9-Gramm-Überlappung mit Testbeispielen in Mathematik- und Code-Benchmarks werden herausgefiltert.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp