Command Palette
Search for a command to run...
Nemotron-Math-v2 Datensatz Für Mathematische Inferenz
Nemotron-Math-v2 ist ein Datensatz für mathematische Inferenz, der von der NVIDIA Corporation im Jahr 2025 veröffentlicht wurde. Zugehörige Forschungsarbeiten umfassen... Nemotron-Math: Effiziente Langzeitkontext-Destillation mathematischer Schlussfolgerungen aus multimodaler Überwachung Es wird in erster Linie dazu verwendet, LLMs darin zu schulen, strukturiertes mathematisches Denken durchzuführen, die Unterschiede zwischen werkzeuggestütztem Denken und reinem sprachlichem Denken zu untersuchen und Systeme für das Denken in langen Kontexten oder mehrspurige Denkprozesse zu entwickeln.
Dieser Datensatz enthält ca. 347.000 hochwertige mathematische Probleme und 7 Millionen modellgenerierte Inferenztrajektorien. Jedes Problem wird in sechs Konfigurationen gelöst: hohe/mittlere/niedrige Inferenztiefe und mit/ohne Python TIR. Die Lösungen werden anschließend mithilfe einer Pipeline validiert, die ein LLM als Arbitrator verwendet.
Datenfelder:
- Problemstellung: Problemstellungen, die aus Quellen wie OpenMathReasoning und MathStackExchange extrahiert wurden.
- Nachrichten: Das Gesprächsprotokoll zwischen Benutzer und Assistent, das für das LLM-Training verwendet wird.
- erwartete_Antwort: Die extrahierte Antwort oder die vom Modell generierte Mehrheitsantwort.
- Metadaten: Erfolgsquote unter verschiedenen Argumentations- und Werkzeugnutzungsszenarien
- Datenquelle: Die Datenquelle ist AoPS oder StackExchange-Math.
- Werkzeug: Die verwendete Werkzeugdefinition oder leer.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.