HyperAIHyperAI

Command Palette

Search for a command to run...

Acteur-Critique Multi-Agents pour des Environnements Mixtes de Coopération et de Compétition

Ryan Lowe; Yi Wu; Aviv Tamar; Jean Harb; Pieter Abbeel; Igor Mordatch

Résumé

Nous explorons les méthodes d'apprentissage par renforcement profond pour les domaines à agents multiples. Nous commençons par analyser la difficulté des algorithmes traditionnels dans le cas de plusieurs agents : l'algorithme Q-learning est confronté à une instabilité inhérente de l'environnement, tandis que le gradient de politique souffre d'une variance qui augmente avec le nombre d'agents. Nous présentons ensuite une adaptation des méthodes acteur-critique qui prend en compte les politiques d'action des autres agents et est capable d'apprendre avec succès des politiques nécessitant une coordination complexe entre plusieurs agents. De plus, nous introduisons un régime d'entraînement utilisant un ensemble de politiques pour chaque agent, ce qui conduit à des politiques plus robustes dans les systèmes multi-agents. Nous démontrons la force de notre approche par rapport aux méthodes existantes dans des scénarios coopératifs ainsi que compétitifs, où les populations d'agents sont capables de découvrir diverses stratégies de coordination physiques et informationnelles.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp