il y a 6 mois

Résumé

Les travaux récents ont mis en évidence le potentiel considérable des jeux de données synthétiques pour l'entraînement des grands modèles linguistiques (LLM), en particulier pour acquérir des compétences ciblées. Les jeux de données actuels d'entraînement à l'instruction mathématique à grande échelle, tels que MetaMathQA (Yu et al., 2024) et MAmmoTH (Yue et al., 2024), sont construits à partir des sorties de modèles linguistiques à code fermé, soumis à des licences commerciales restrictives. Une des raisons principales limitant l'utilisation des modèles linguistiques open-source dans ces chaînes de génération de données réside dans l’écart important entre les compétences mathématiques des meilleurs modèles fermés, comme GPT-4, et celles des meilleurs modèles open-source. S'appuyant sur les progrès récents réalisés dans les modèles linguistiques open-source, sur notre nouvelle approche de prompting, ainsi que sur une certaine escalade par force brute, nous avons construit OpenMathInstruct-1, un jeu de données d'entraînement par instruction mathématique comprenant 1,8 million de paires problème-solution. Ce jeu de données a été généré en synthétisant des solutions via un interpréteur de code pour deux benchmarks populaires de raisonnement mathématique : GSM8K et MATH, en utilisant le modèle Mixtral, récemment publié et distribué sous une licence permissive. Notre meilleur modèle, OpenMath-CodeLlama-70B, entraîné sur un sous-ensemble d'OpenMathInstruct-1, atteint un score de 84,6 % sur GSM8K et de 50,7 % sur MATH, ce qui est compétitif avec les meilleurs modèles gpt-distilled. Nous mettons à disposition notre code, nos modèles et le jeu de données OpenMathInstruct-1 sous une licence commercialement permissive.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Shubham Toshniwal Ivan Moshkov Sean Narenthiran Daria Gitman Fei Jia Igor Gitman

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Shubham Toshniwal Ivan Moshkov Sean Narenthiran Daria Gitman Fei Jia Igor Gitman

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

OpenMathInstruct-1 : Un jeu de données d'entraînement par instruction mathématique de 1,8 million de samples | Articles | HyperAI

Command Palette

OpenMathInstruct-1 : Un jeu de données d'entraînement par instruction mathématique de 1,8 million de samples

Shubham Toshniwal Ivan Moshkov Sean Narenthiran Daria Gitman Fei Jia Igor Gitman

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

OpenMathInstruct-1 : Un jeu de données d'entraînement par instruction mathématique de 1,8 million de samples

Shubham Toshniwal Ivan Moshkov Sean Narenthiran Daria Gitman Fei Jia Igor Gitman

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

OpenMathInstruct-1 : Un jeu de données d'entraînement par instruction mathématique de 1,8 million de samples

Shubham Toshniwal Ivan Moshkov Sean Narenthiran Daria Gitman Fei Jia Igor Gitman

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters