Command Palette
Search for a command to run...
Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz
Datum
Paper-URL
Lizenz
CC BY 4.0
Nemotron-SFT-Math-v4 ist ein Datensatz für mathematische Inferenz, der von NVIDIA im Mai 2026 veröffentlicht wurde. Die zugehörigen Forschungsarbeiten sind folgende: Nemotron-Math: Effiziente Langzeitkontext-Destillation mathematischer Schlussfolgerungen aus multimodaler ÜberwachungZiel ist es, die Probleme der inkonsistenten Qualität traditioneller mathematischer Datensätze, nicht-standardmäßiger Schlussfolgerungspfade, geringer Genauigkeit und begrenzter Anwendungsszenarien zu lösen. Es verbessert effektiv das strukturierte Schließen, das Schließen über mehrere Trajektorien hinweg und die Antwortverifizierungsfähigkeiten des Modells. Es findet breite Anwendung bei der Feinabstimmung umfangreicher mathematischer Schlussfolgerungsmodelle, der Analyse von Schlussfolgerungspfaden, der Entwicklung von Algorithmen zur Antwortverifizierung, dem Aufbau von Systemen für das Schließen über lange Kontexte und der Bewertung der Robustheit von Modellschlussfolgerungen. Dieser Datensatz umfasst 545.431 Trainingsbeispiele, darunter 285.516 Beispiele für logisches Denken aus dem COT-Tool und 259.915 Beispiele für logisches Denken aus dem TIR-Tool. Er deckt mathematische Szenarien aus Wettbewerben und universitären Forschungsarbeiten in Algebra, Geometrie, Zahlentheorie, Kombinatorik usw. ab. Die Daten wurden mithilfe einer hybriden manuellen und automatisierten Methode annotiert und enthalten standardisierte Felder wie eindeutige Nummer, Fragetext, mehrstufiger Dialog, Standardantwort, Quelle und Protokoll.
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.