HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Discuter sur Discord

Date

il y a 22 jours

Organisation

NVIDIA

URL du document

2512.15489

Licence

CC BY-SA 4.0

Nemotron-Math-v2 est un jeu de données d'inférence mathématique publié par NVIDIA Corporation en 2025. Parmi les articles de recherche associés, on peut citer… Nemotron-Math : Distillation efficace du raisonnement mathématique à long contexte à partir d'une supervision multimodale Il est principalement utilisé pour former les LLM à effectuer un raisonnement mathématique structuré, pour étudier les différences entre le raisonnement assisté par outils et le raisonnement en langage pur, et pour construire des systèmes de raisonnement à contexte long ou à voies multiples.

Cet ensemble de données contient environ 347 000 problèmes mathématiques de haute qualité et 7 millions de trajectoires d'inférence générées par des modèles. Chaque problème est résolu selon six configurations : profondeur d'inférence élevée, moyenne et faible, avec ou sans Python TIR. Les réponses sont validées par un pipeline utilisant un LLM comme arbitre.

Champs de données:

  • Problème : Énoncés de problèmes extraits de sources telles que OpenMathReasoning et MathStackExchange.
  • Messages : Journal de conversation de l'utilisateur et de son assistant, utilisé pour la formation LLM.
  • expected_answer : La réponse extraite ou la réponse ayant obtenu le vote majoritaire généré par le modèle.
  • Métadonnées : Taux de réussite selon différents scénarios de raisonnement et d'utilisation des outils
  • data_source : La source de données est AoPS ou StackExchange-Math
  • outil : définition de l’outil utilisé, ou vide.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp