HyperAIHyperAI

Command Palette

Search for a command to run...

Reduzierung der Überbewertungsverzerrung in Multi-Agenten-Domänen mittels doppelter zentraler Kritiker

Johannes Ackermann Volker Gabler Takayuki Osa Masashi Sugiyama

Zusammenfassung

Viele Aufgaben in der realen Welt erfordern die Zusammenarbeit mehrerer Agenten. In den letzten Jahren wurden mehragentenbasierte Methoden des Verstärkungslernens (Reinforcement Learning, RL) vorgeschlagen, um solche Aufgaben zu lösen, doch zeigen derzeitige Ansätze oft eine ineffiziente Lernleistung hinsichtlich der Politiken. Wir untersuchen daher, ob ein bekannter Schwachpunkt des Einzelagenten-RL – die Überbewertung der Wertfunktion (value function overestimation bias) – auch im mehragentenbasierten Kontext auftritt. Auf Basis unserer Erkenntnisse schlagen wir einen Ansatz vor, der diesen Bias durch die Verwendung von doppelten zentralisierten Kritikern reduziert. Wir evaluieren unsere Methode an sechs Aufgaben mit gemischten kooperativen und kompetitiven Dynamiken und zeigen, dass sie gegenüber aktuellen Methoden erhebliche Vorteile bietet. Schließlich untersuchen wir die Anwendung mehragentenbasierter Ansätze auf hochdimensionale robotische Aufgaben und zeigen, dass unser Ansatz zur Lernung dezentraler Politiken in diesem Bereich eingesetzt werden kann.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp