il y a 6 mois

Résumé

Bien que les modèles de langage (LM) aient montré un potentiel prometteur dans diverses tâches de prise de décision, leur dépendance vis-à-vis de processus d’action simples limite leur déploiement généralisé en tant qu’agents autonomes. Dans cet article, nous introduisons Language Agent Tree Search (LATS), le premier cadre général qui synergie les capacités des LM en raisonnement, action et planification. En exploitant la capacité d’apprentissage in-context des LM, nous intégrons la recherche arborescente de Monte Carlo dans LATS afin de permettre aux LM d’agir en tant qu’agents, accompagnés de fonctions de valeur pilotées par LM et de réflexions auto-évaluatives, favorisant ainsi une exploration efficace et une prise de décision améliorée. Une caractéristique clé de notre approche réside dans l’intégration d’un environnement fournissant un retour d’information externe, offrant ainsi un mécanisme de résolution de problèmes plus réfléchi et adaptable, dépassant les limites des techniques existantes. Notre évaluation expérimentale sur des domaines variés — programmation, réponse interactive à des questions (QA), navigation web et mathématiques — valide l’efficacité et la généralité de LATS dans la prise de décision, tout en maintenant des performances de raisonnement compétitives ou améliorées. Notamment, LATS atteint une précision pass@1 de pointe (92,7 %) pour la programmation sur HumanEval avec GPT-4, et démontre une performance sans gradients (score moyen de 75,9) comparable à celle de l’ajustement fin par gradients pour la navigation web sur WebShop avec GPT-3.5. Le code est disponible à l’adresse suivante : https://github.com/lapisrocks/LanguageAgentTreeSearch

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Andy Zhou Kai Yan Michal Shlapentokh-Rothman Haohan Wang Yu-Xiong Wang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Andy Zhou Kai Yan Michal Shlapentokh-Rothman Haohan Wang Yu-Xiong Wang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Recherche arborescente par Agent langagier unifie le raisonnement, l'action et la planification dans les modèles de langage

Andy Zhou Kai Yan Michal Shlapentokh-Rothman Haohan Wang Yu-Xiong Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Recherche arborescente par Agent langagier unifie le raisonnement, l'action et la planification dans les modèles de langage

Andy Zhou Kai Yan Michal Shlapentokh-Rothman Haohan Wang Yu-Xiong Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Recherche arborescente par Agent langagier unifie le raisonnement, l'action et la planification dans les modèles de langage

Andy Zhou Kai Yan Michal Shlapentokh-Rothman Haohan Wang Yu-Xiong Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters