Command Palette
Search for a command to run...
Regenbogen: Kombination von Verbesserungen im tiefen Reinforcement Learning
Regenbogen: Kombination von Verbesserungen im tiefen Reinforcement Learning
Tom Schaul Junyoung Chung David Hessel David Silver Volodymyr Mnih
Zusammenfassung
Die Community des tiefen Reinforcement Learnings hat mehrere unabhängige Verbesserungen des DQN-Algorithmus vorgenommen. Es ist jedoch unklar, welche dieser Erweiterungen komplementär sind und fruchtbar kombiniert werden können. Diese Arbeit untersucht sechs Erweiterungen des DQN-Algorithmus und studiert ihre Kombination empirisch. Unsere Experimente zeigen, dass die Kombination sowohl hinsichtlich der Dateneffizienz als auch der endgültigen Leistung auf dem Atari 2600-Benchmark eine Spitzenleistung erzielt. Wir stellen zudem Ergebnisse einer detaillierten Ablationsstudie vor, die den Beitrag jeder Komponente zur Gesamtleistung verdeutlicht.