HyperAIHyperAI

Command Palette

Search for a command to run...

Améliorer les raisonnements des grands modèles linguistiques grâce à un vérificateur conscient des étapes

Yifei Li Zeqi Lin Shizhuo Zhang Qiang Fu Bei Chen Jian-Guang Lou Weizhu Chen

Résumé

L’apprentissage à peu d’exemples est une tâche difficile qui exige que les modèles linguistiques généralisent à partir d’un nombre limité d’exemples. Les grands modèles linguistiques tels que GPT-3 et PaLM ont réalisé des progrès remarquables dans ce domaine, mais ils peinent encore à résoudre certaines tâches de raisonnement, comme GSM8K, un benchmark dédié aux problèmes arithmétiques. Pour améliorer leurs capacités de raisonnement, des travaux antérieurs ont proposé d’orienter les modèles linguistiques à l’aide de prompts qui incitent à produire une série d’étapes de raisonnement avant de donner la réponse finale, permettant d’atteindre une amélioration significative sur GSM8K, passant de 17,9 % à 58,1 % en taux de résolution des problèmes. Dans cet article, nous présentons DIVERSE (Diverse Verifier on Reasoning Step), une nouvelle approche visant à renforcer davantage les capacités de raisonnement des modèles linguistiques. DIVERSE se compose de trois composants principaux : premièrement, elle génère des prompts diversifiés afin d’explorer différentes voies de raisonnement pour une même question ; deuxièmement, elle utilise un vérificateur basé sur un système de vote pondéré pour éliminer les réponses incorrectes ; troisièmement, elle vérifie chaque étape de raisonnement individuellement, plutôt que toute la chaîne d’inférence dans son ensemble. Nous évaluons DIVERSE sur le modèle linguistique le plus récent, code-davinci-002, et montrons qu’il atteint de nouveaux états de l’art sur six des huit benchmarks de raisonnement (par exemple, GSM8K passe de 74,4 % à 83,2 %).


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Améliorer les raisonnements des grands modèles linguistiques grâce à un vérificateur conscient des étapes | Articles | HyperAI