HyperAIHyperAI

Command Palette

Search for a command to run...

Wert-Zerlegungs-Netzwerke für kooperatives Mehragentenlernen

Peter Sunehag; Guy Lever; Audrunas Gruslys; Wojciech Marian Czarnecki; Vinicius Zambaldi; Max Jaderberg; Marc Lanctot; Nicolas Sonnerat; Joel Z. Leibo; Karl Tuyls; Thore Graepel

Zusammenfassung

Wir untersuchen das Problem der kooperativen Mehragenten-Reinforcement-Learning mit einem einzigen gemeinsamen Belohnungssignal. Diese Klasse von Lernproblemen ist schwierig aufgrund der oft großen kombinierten Aktion- und Beobachtungsräume. In den voll zentralisierten und dezentralisierten Ansätzen identifizieren wir das Problem der irreführenden Belohnungen sowie ein Phänomen, das wir als das "faule Agent"-Problem bezeichnen, welches durch partielle Beobachtbarkeit entsteht. Wir lösen diese Probleme, indem wir einzelne Agenten mit einer neuartigen Netzarchitektur zur Wertezerlegung trainieren, die lernt, die Team-Wertefunktion in agentenspezifische Wertefunktionen zu zerlegen. Wir führen eine experimentelle Auswertung in verschiedenen teilbeobachtbaren Mehragentendomains durch und zeigen, dass das Lernen solcher Wertezerlegungen zu überlegenen Ergebnissen führt, insbesondere wenn es mit Gewichteteilung, Rolleninformationen und Informationskanälen kombiniert wird.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp