il y a 6 mois

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan

Résumé

Les progrès récents observés dans les grands modèles linguistiques (LLM), tels que GPT-4 et PaLM-2, ont permis des avancées significatives dans la résolution de problèmes de raisonnement mathématique. En particulier, la dernière version de GPT-4 d’OpenAI, connue sous le nom de GPT-4 Code Interpreter, démontre des performances remarquables sur des jeux de données mathématiques exigeants. Dans ce travail, nous étudions l’impact du code sur l’amélioration de la capacité de raisonnement des LLM en introduisant différentes contraintes sur la fréquence d’utilisation du code du GPT-4 Code Interpreter. Nous constatons que son succès s’explique largement par ses compétences puissantes dans la génération et l’exécution de code, l’évaluation des résultats d’exécution, ainsi que la correction de ses solutions lorsqu’un résultat jugé irraisonnable est obtenu. À partir de cette observation, nous proposons une nouvelle méthode d’encodage efficace, appelée vérification auto-basée sur le code explicite (CSV, explicit code-based self-verification), destinée à renforcer davantage le potentiel de raisonnement mathématique du GPT-4 Code Interpreter. Cette méthode utilise un prompt zéro-shot adressé au GPT-4 Code Interpreter afin de l’inciter à utiliser le code pour vérifier automatiquement ses réponses. Lorsque l’état de vérification est enregistré comme « False », le modèle corrige automatiquement sa solution, suivant un principe similaire à celui que nous appliquons pour rectifier les erreurs lors d’un examen de mathématiques. En outre, nous observons que l’état du résultat de vérification reflète le niveau de confiance attaché à une solution, ce qui améliore l’efficacité de la méthode de vote majoritaire. Grâce au GPT-4 Code Interpreter combiné à la méthode CSV, nous atteignons une précision zéro-shot impressionnante sur le jeu de données MATH (passant de 53,9 % à 84,3 %).

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Traitement Du Langage Naturel

Tâche

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Traitement Du Langage Naturel

Tâche

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Résolution de problèmes mathématiques complexes à l’aide de l’interprète de code GPT-4 avec vérification auto-suffisante basée sur le code | Articles | HyperAI

Command Palette

Résolution de problèmes mathématiques complexes à l’aide de l’interprète de code GPT-4 avec vérification auto-suffisante basée sur le code

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan1 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Résolution de problèmes mathématiques complexes à l’aide de l’interprète de code GPT-4 avec vérification auto-suffisante basée sur le code

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan1 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Résolution de problèmes mathématiques complexes à l’aide de l’interprète de code GPT-4 avec vérification auto-suffisante basée sur le code

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan1 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan

Aojun Zhou Ke Wang Zimu Lu Weikang Shi Sichun Luo Zipeng Qin Shaoqing Lu Anya Jia Linqi Song Mingjie Zhan