HyperAIHyperAI

Command Palette

Search for a command to run...

Sélection automatique de modèles avec des grands modèles linguistiques pour le raisonnement

James Xu Zhao Yuxi Xie Kenji Kawaguchi Junxian He Michael Qizhe Xie

Résumé

Le Chain-of-Thought (CoT) et les modèles linguistiques aidés par programme (PAL) représentent deux approches distinctes du raisonnement, chacune présentant ses propres avantages. Le CoT utilise un langage naturel, offrant flexibilité et interprétabilité, tandis que le PAL s'appuie sur un langage de programmation, permettant un raisonnement plus structuré et rigoureux. Nous introduisons une méthode de sélection de modèle visant à combiner les forces des deux approches en utilisant un grand modèle linguistique (LLM) pour sélectionner dynamiquement entre elles. Notre analyse théorique souligne la faisabilité de cette méthode, confirmée par des résultats empiriques. Notre approche montre des améliorations significatives de performance sur huit jeux de données de raisonnement, avec Codex, ChatGPT et GPT-4. En outre, notre méthode s'avère complémentaire à la self-consistency : lorsqu'elle est intégrée, elle améliore encore davantage les performances tout en réduisant de manière significative les coûts computationnels. Enfin, nous obtenons de nouveaux résultats état-de-l'art sur GSM8K et SVAMP, avec des précisions respectives de 96,8 % et 93,7 %. Notre code, nos données et nos prompts sont disponibles à l'adresse suivante : https://github.com/XuZhao0/Model-Selection-Reasoning


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp