vor 2 Monaten
Regenbogen: Kombination von Verbesserungen im tiefen Reinforcement Learning
Matteo Hessel; Joseph Modayil; Hado van Hasselt; Tom Schaul; Georg Ostrovski; Will Dabney; Dan Horgan; Bilal Piot; Mohammad Azar; David Silver

Abstract
Die Community des tiefen Reinforcement Learnings hat mehrere unabhängige Verbesserungen des DQN-Algorithmus vorgenommen. Es ist jedoch unklar, welche dieser Erweiterungen komplementär sind und fruchtbar kombiniert werden können. Diese Arbeit untersucht sechs Erweiterungen des DQN-Algorithmus und studiert ihre Kombination empirisch. Unsere Experimente zeigen, dass die Kombination sowohl hinsichtlich der Dateneffizienz als auch der endgültigen Leistung auf dem Atari 2600-Benchmark eine Spitzenleistung erzielt. Wir stellen zudem Ergebnisse einer detaillierten Ablationsstudie vor, die den Beitrag jeder Komponente zur Gesamtleistung verdeutlicht.