Command Palette
Search for a command to run...
AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren
AceReason-1.1-SFT ist ein vielfältiger und hochwertiger Supervised Fine-Tuning-Datensatz (SFT), der 2025 von NVIDIA veröffentlicht wurde und sich auf mathematisches Denken und Code-Reasoning konzentriert. Die zugehörigen Ergebnisse sind:AceReason-Nemotron 1.1: Fortschrittliche Mathematik und Code-Reasoning durch SFT- und RL-Synergie“, dessen Ziel es ist, SFT-Modelle zu trainieren, die sich auf mathematisches Denken und Code-Argumentation konzentrieren.
Dieser Datensatz dient als mathematisches und Code-Argumentationsmodell AceReason-Nemotron-1.1-7B SFT-Trainingsdaten von , alle Antworten im Datensatz werden von DeepSeek-R1 generiert.
Der AceReason-1.1-SFT-Datensatz enthält 2.668.741 mathematische Beispiele und 1.301.591 Codebeispiele und deckt Daten von OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, Leetcode, TACO und Apps ab. Der Datensatz wurde bereinigt und Beispiele mit 9-Gramm-Überlappung mit Testbeispielen in Mathematik- und Code-Benchmarks werden herausgefiltert.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.