AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren
Datum
Veröffentlichungs-URL
Kategorien
AceReason-1.1-SFT ist ein vielfältiger und hochwertiger Supervised Fine-Tuning-Datensatz (SFT), der 2025 von NVIDIA veröffentlicht wurde und sich auf mathematisches Denken und Code-Reasoning konzentriert. Die zugehörigen Ergebnisse sind:AceReason-Nemotron 1.1: Fortschrittliche Mathematik und Code-Reasoning durch SFT- und RL-Synergie“, dessen Ziel es ist, SFT-Modelle zu trainieren, die sich auf mathematisches Denken und Code-Argumentation konzentrieren.
Dieser Datensatz dient als mathematisches und Code-Argumentationsmodell AceReason-Nemotron-1.1-7B SFT-Trainingsdaten von , alle Antworten im Datensatz werden von DeepSeek-R1 generiert.
Der AceReason-1.1-SFT-Datensatz enthält 2.668.741 mathematische Beispiele und 1.301.591 Codebeispiele und deckt Daten von OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, Leetcode, TACO und Apps ab. Der Datensatz wurde bereinigt und Beispiele mit 9-Gramm-Überlappung mit Testbeispielen in Mathematik- und Code-Benchmarks werden herausgefiltert.