HyperAIHyperAI

Command Palette

Search for a command to run...

QTRAN : Apprendre à Factoriser avec Transformation pour l'Apprentissage par Renforcement Coopératif Multi-Agents

Kyunghwan Son Daewoo Kim Wan Ju Kang David Hostallero Yung Yi

Résumé

Nous explorons des solutions basées sur la valeur pour les tâches d'apprentissage par renforcement multi-agent (MARL) dans le régime de formation centralisée avec exécution décentralisée (CTDE), récemment popularisé. Cependant, VDN et QMIX sont des exemples représentatifs qui utilisent l'idée de factorisation de la fonction de valeur d'action conjointe en fonctions individuelles pour une exécution décentralisée. VDN et QMIX ne traitent qu'une fraction des tâches MARL factorisables en raison de leurs contraintes structurelles dans la factorisation, telles que l'additivité et la monotonie. Dans cet article, nous proposons une nouvelle méthode de factorisation pour MARL, QTRAN, qui est libre de ces contraintes structurelles et adopte une nouvelle approche pour transformer la fonction de valeur d'action conjointe originale en une fonction facilement factorisable, tout en conservant les mêmes actions optimales. QTRAN garantit une factorisation plus générale que VDN ou QMIX, couvrant ainsi une classe beaucoup plus large de tâches MARL que les méthodes précédentes. Nos expériences sur les tâches de compression gaussienne multi-domaines et un prédateur-proie modifié montrent une performance supérieure de QTRAN, avec des marges particulièrement importantes dans les jeux dont les gains pénalisent plus sévèrement le comportement non coopératif.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
QTRAN : Apprendre à Factoriser avec Transformation pour l'Apprentissage par Renforcement Coopératif Multi-Agents | Articles | HyperAI