Command Palette
Search for a command to run...
AceMath Instruct Trainingsdaten Datensatz Zum Mathematischen Denken
AceMath Instruct Training Data ist ein 2025 von NVIDIA veröffentlichter Datensatz zum Trainieren von AceMath-Modellen mit dem Ziel, die Leistung des Modells bei mathematischen Denkaufgaben zu verbessern. Die entsprechenden Ergebnisse der Studie sind „AceMath: Fortschrittliches mathematisches Denken mit Post-Training und Belohnungsmodellierung".
Dieser Datensatz enthält mehrere Phasen der Feinabstimmung der Daten. general_sft_stage1 Enthält 2.261.687 Beispiele, die hauptsächlich Beispiele zur Feinabstimmung von Anweisungen in den Bereichen Code und Mathematik abdecken. general_sft_stage2 Enthält 1.634.573 Beispiele, erweitert um Code, Mathematik und Feinabstimmung allgemeiner Domänenanweisungen; und speziell für den mathematischen Bereich math_sft Es enthält 1.661.094 Beispiele und konzentriert sich auf die Verbesserung der mathematischen Denkfähigkeiten. Bei der Generierung dieser Daten werden die Modelle Qwen2.5-Math-72B-Instruct und GPT-4o-mini kombiniert, um die Vielfalt und hohe Qualität der Daten sicherzustellen.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.