HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

Auf Discord diskutieren

Datum

vor 22 Tagen

Organisation

NVIDIA

Paper-URL

2512.15489

Lizenz

CC BY-SA 4.0

Nemotron-Math-v2 ist ein Datensatz für mathematische Inferenz, der von der NVIDIA Corporation im Jahr 2025 veröffentlicht wurde. Zugehörige Forschungsarbeiten umfassen... Nemotron-Math: Effiziente Langzeitkontext-Destillation mathematischer Schlussfolgerungen aus multimodaler Überwachung Es wird in erster Linie dazu verwendet, LLMs darin zu schulen, strukturiertes mathematisches Denken durchzuführen, die Unterschiede zwischen werkzeuggestütztem Denken und reinem sprachlichem Denken zu untersuchen und Systeme für das Denken in langen Kontexten oder mehrspurige Denkprozesse zu entwickeln.

Dieser Datensatz enthält ca. 347.000 hochwertige mathematische Probleme und 7 Millionen modellgenerierte Inferenztrajektorien. Jedes Problem wird in sechs Konfigurationen gelöst: hohe/mittlere/niedrige Inferenztiefe und mit/ohne Python TIR. Die Lösungen werden anschließend mithilfe einer Pipeline validiert, die ein LLM als Arbitrator verwendet.

Datenfelder:

  • Problemstellung: Problemstellungen, die aus Quellen wie OpenMathReasoning und MathStackExchange extrahiert wurden.
  • Nachrichten: Das Gesprächsprotokoll zwischen Benutzer und Assistent, das für das LLM-Training verwendet wird.
  • erwartete_Antwort: Die extrahierte Antwort oder die vom Modell generierte Mehrheitsantwort.
  • Metadaten: Erfolgsquote unter verschiedenen Argumentations- und Werkzeugnutzungsszenarien
  • Datenquelle: Die Datenquelle ist AoPS oder StackExchange-Math.
  • Werkzeug: Die verwendete Werkzeugdefinition oder leer.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp