HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Réglage Des Instructions Mathématiques OpenMathInstruct-2

Date

il y a un an

Taille

10.23 GB

Organisation

NVIDIA

URL du document

arxiv.org

OpenMathInstruct-2 est un ensemble de données d'instructions mathématiques open source à grande échelle publié par NVIDIA en 2024, qui vise à accélérer les progrès de l'intelligence artificielle en mathématiques. Les résultats de l'article connexe sont «OpenMathInstruct-2 : Accélérer l'IA pour les mathématiques grâce à des données d'instructions open source massivesL'ensemble de données contient 14 millions de paires question-réponse (environ 600 000 questions uniques), ce qui le rend près de huit fois plus volumineux que le précédent ensemble de données le plus important du genre. En affinant le modèle Llama-3.1-8B-Base avec OpenMathInstruct-2, ses performances sur l'ensemble de données MATH sont améliorées de 15,91 TP3T par rapport à Llama3.1-8B-Instruct (de 51,91 TP3T à 67,81 TP3T).

L'ensemble de données OpenMathInstruct-2 contient les champs suivants :

  • problème: Problèmes originaux, soit issus des ensembles d'entraînement GSM8K ou MATH, soit des problèmes augmentés à partir de ces ensembles d'entraînement.
  • solution_générée:La solution générée synthétiquement.
  • réponse_attendue:Pour les questions de l'ensemble d'entraînement, il s'agit de la véritable réponse de référence fournie dans l'ensemble de données. Pour les questions renforcées, il s'agit de la réponse obtenue à la majorité des voix.
  • source_du_problème: Indique que le problème provient directement de GSM8K ou de MATH, ou qu'il s'agit d'une version améliorée dérivée de l'un ou l'autre ensemble de données.
Exemple de structure d'ensemble de données

OpenMathInstruct-2.torrent
Seeding 1Téléchargement 0Terminé 151Total Downloads 173
  • OpenMathInstruct-2/
    • README.md
      1.85 KB
    • README.txt
      3.7 KB
      • data/
        • OpenMathInstruct-2.zip
          10.23 GB

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp