HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 19 jours

DR. WELL : Raisonnement dynamique et apprentissage fondés sur un modèle mondial symbolique pour la collaboration multi-agents basée sur des LLM incarnés

Narjes Nourzad Hanqing Yang Shiyu Chen Carlee Joe-Wong

DR. WELL : Raisonnement dynamique et apprentissage fondés sur un modèle mondial symbolique pour la collaboration multi-agents basée sur des LLM incarnés

Résumé

La planification coopérative multi-agents exige que les agents prennent des décisions conjointes en disposant d’informations partielles et d’une communication limitée. La coordination au niveau des trajectoires échoue souvent, car de petites déviations temporelles ou de mouvement se propagent rapidement et entraînent des conflits. La planification symbolique atténue ce défi en augmentant le niveau d’abstraction et en proposant un vocabulaire minimal d’actions permettant la synchronisation et la progression collective. Nous présentons DR. WELL, un cadre neurosymbolique décentralisé pour la planification coopérative multi-agents. La coopération s’opère via un protocole de négociation en deux phases : les agents proposent d’abord des rôles candidats accompagnés de raisonnements, puis s’engagent dans une allocation conjointe sous réserve d’un consensus et de contraintes environnementales. Une fois l’engagement pris, chaque agent génère et exécute indépendamment une planification symbolique correspondant à son rôle, sans révéler les détails des trajectoires. Ces plans sont ancrés dans les résultats d’exécution grâce à un modèle du monde partagé, qui encode l’état actuel de l’environnement et se met à jour à mesure que les agents agissent. En raisonnant sur des plans symboliques plutôt que sur des trajectoires brutes, DR. WELL évite l’alignement rigide au niveau des étapes et permet des opérations de haut niveau réutilisables, synchronisables et interprétables. Des expériences sur des tâches de poussée de blocs coopératives montrent que les agents s’adaptent d’un épisode à l’autre, le modèle du monde dynamique capturant des motifs réutilisables et améliorant les taux de réussite et l’efficacité. Ces expériences démontrent que notre modèle du monde dynamique améliore la réussite des tâches et l’efficacité grâce à une négociation et une auto-réflexion itérative, en échangeant un surcoût temporel contre l’évolution de stratégies de collaboration de plus en plus efficaces.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DR. WELL : Raisonnement dynamique et apprentissage fondés sur un modèle mondial symbolique pour la collaboration multi-agents basée sur des LLM incarnés | Articles de recherche | HyperAI