HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Date

il y a 2 jours

Organization

NVIDIA

License

CC BY-SA 4.0

Nemotron-Math-v2 est un jeu de données d'inférence mathématique publié par NVIDIA Corporation en 2025. Parmi les articles de recherche associés, on peut citer… Nemotron-Math : Distillation efficace du raisonnement mathématique à long contexte à partir d'une supervision multimodale Il est principalement utilisé pour former les LLM à effectuer un raisonnement mathématique structuré, pour étudier les différences entre le raisonnement assisté par outils et le raisonnement en langage pur, et pour construire des systèmes de raisonnement à contexte long ou à voies multiples.

Cet ensemble de données contient environ 347 000 problèmes mathématiques de haute qualité et 7 millions de trajectoires d'inférence générées par des modèles. Chaque problème est résolu selon six configurations : profondeur d'inférence élevée, moyenne et faible, avec ou sans Python TIR. Les réponses sont validées par un pipeline utilisant un LLM comme arbitre.

Champs de données:

  • Problème : Énoncés de problèmes extraits de sources telles que OpenMathReasoning et MathStackExchange.
  • Messages : Journal de conversation de l'utilisateur et de son assistant, utilisé pour la formation LLM.
  • expected_answer : La réponse extraite ou la réponse ayant obtenu le vote majoritaire généré par le modèle.
  • Métadonnées : Taux de réussite selon différents scénarios de raisonnement et d'utilisation des outils
  • data_source : La source de données est AoPS ou StackExchange-Math
  • outil : définition de l’outil utilisé, ou vide.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp