HyperAI

AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren

Datum

vor 5 Tagen

Organisation

NVIDIA

Veröffentlichungs-URL

huggingface.co

Download-Hilfe

AceReason-1.1-SFT ist ein vielfältiger und hochwertiger Supervised Fine-Tuning-Datensatz (SFT), der 2025 von NVIDIA veröffentlicht wurde und sich auf mathematisches Denken und Code-Reasoning konzentriert. Die zugehörigen Ergebnisse sind:AceReason-Nemotron 1.1: Fortschrittliche Mathematik und Code-Reasoning durch SFT- und RL-Synergie“, dessen Ziel es ist, SFT-Modelle zu trainieren, die sich auf mathematisches Denken und Code-Argumentation konzentrieren.

Dieser Datensatz dient als mathematisches und Code-Argumentationsmodell AceReason-Nemotron-1.1-7B SFT-Trainingsdaten von , alle Antworten im Datensatz werden von DeepSeek-R1 generiert.

Der AceReason-1.1-SFT-Datensatz enthält 2.668.741 mathematische Beispiele und 1.301.591 Codebeispiele und deckt Daten von OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, Leetcode, TACO und Apps ab. Der Datensatz wurde bereinigt und Beispiele mit 9-Gramm-Überlappung mit Testbeispielen in Mathematik- und Code-Benchmarks werden herausgefiltert.