HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

Date

vor 2 Tagen

Organization

NVIDIA

License

CC BY-SA 4.0

Nemotron-Math-v2 ist ein Datensatz für mathematische Inferenz, der von der NVIDIA Corporation im Jahr 2025 veröffentlicht wurde. Zugehörige Forschungsarbeiten umfassen... Nemotron-Math: Effiziente Langzeitkontext-Destillation mathematischer Schlussfolgerungen aus multimodaler Überwachung Es wird in erster Linie dazu verwendet, LLMs darin zu schulen, strukturiertes mathematisches Denken durchzuführen, die Unterschiede zwischen werkzeuggestütztem Denken und reinem sprachlichem Denken zu untersuchen und Systeme für das Denken in langen Kontexten oder mehrspurige Denkprozesse zu entwickeln.

Dieser Datensatz enthält ca. 347.000 hochwertige mathematische Probleme und 7 Millionen modellgenerierte Inferenztrajektorien. Jedes Problem wird in sechs Konfigurationen gelöst: hohe/mittlere/niedrige Inferenztiefe und mit/ohne Python TIR. Die Lösungen werden anschließend mithilfe einer Pipeline validiert, die ein LLM als Arbitrator verwendet.

Datenfelder:

  • Problemstellung: Problemstellungen, die aus Quellen wie OpenMathReasoning und MathStackExchange extrahiert wurden.
  • Nachrichten: Das Gesprächsprotokoll zwischen Benutzer und Assistent, das für das LLM-Training verwendet wird.
  • erwartete_Antwort: Die extrahierte Antwort oder die vom Modell generierte Mehrheitsantwort.
  • Metadaten: Erfolgsquote unter verschiedenen Argumentations- und Werkzeugnutzungsszenarien
  • Datenquelle: Die Datenquelle ist AoPS oder StackExchange-Math.
  • Werkzeug: Die verwendete Werkzeugdefinition oder leer.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp