HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 7 jours

WebCoach : Agents web auto-évoluant avec une orientation mémoire trans-session

Genglin Liu Shijie Geng Sha Li Hejie Cui Sarah Zhang Xin Liu Tianyi Liu

WebCoach : Agents web auto-évoluant avec une orientation mémoire trans-session

Résumé

Les agents alimentés par des modèles linguistiques multimodaux (LLM) ont récemment fait preuve de capacités remarquables en navigation web, permettant aux agents de mener à bien des tâches de navigation complexes dans divers domaines. Toutefois, les agents actuels peinent à surmonter des erreurs répétitives et manquent de capacité à tirer parti des expériences passées entre les sessions, ce qui limite leur robustesse à long terme et leur efficacité en termes d’échantillonnage. Nous proposons WebCoach, un cadre auto-évolutive indépendant du modèle, qui doté les agents de navigation web d’une mémoire persistante à travers les sessions, permettant ainsi une meilleure planification à long terme, une réflexion approfondie et un apprentissage continu sans re-entraînement. WebCoach se compose de trois composants clés : (1) un WebCondenser, qui transforme les journaux bruts de navigation en résumés concis ; (2) un Stockage de Mémoire Externe, qui organise les trajectoires complètes en expériences épisodiques ; et (3) un Coach, qui récupère les expériences pertinentes selon leur similarité et leur récence, et décide si injecter ou non des conseils spécifiques à la tâche dans l’agent via des hooks en temps réel. Cette architecture permet aux agents web d’accéder à une mémoire à long terme au-delà de la fenêtre contextuelle native, améliorant ainsi leur robustesse dans les tâches de navigation complexes. En outre, WebCoach permet une auto-évolution en curant continuellement la mémoire épisodique à partir de nouvelles trajectoires de navigation, permettant aux agents de s’améliorer progressivement sans re-entraînement. Les évaluations sur le benchmark WebVoyager montrent que WebCoach améliore de manière cohérente les performances des agents de navigation web sur trois modèles LLM différents. Avec un modèle de 38 milliards de paramètres, il fait passer le taux de réussite des tâches de 47 % à 61 %, tout en réduisant ou en maintenant le nombre moyen d’étapes. Notamment, des modèles de base plus petits équipés de WebCoach atteignent une performance comparable à celle du même agent web utilisant GPT-4o.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
WebCoach : Agents web auto-évoluant avec une orientation mémoire trans-session | Articles de recherche | HyperAI