HyperAIHyperAI
vor 2 Monaten

Regenbogen: Kombination von Verbesserungen im tiefen Reinforcement Learning

Matteo Hessel; Joseph Modayil; Hado van Hasselt; Tom Schaul; Georg Ostrovski; Will Dabney; Dan Horgan; Bilal Piot; Mohammad Azar; David Silver
Regenbogen: Kombination von Verbesserungen im tiefen Reinforcement Learning
Abstract

Die Community des tiefen Reinforcement Learnings hat mehrere unabhängige Verbesserungen des DQN-Algorithmus vorgenommen. Es ist jedoch unklar, welche dieser Erweiterungen komplementär sind und fruchtbar kombiniert werden können. Diese Arbeit untersucht sechs Erweiterungen des DQN-Algorithmus und studiert ihre Kombination empirisch. Unsere Experimente zeigen, dass die Kombination sowohl hinsichtlich der Dateneffizienz als auch der endgültigen Leistung auf dem Atari 2600-Benchmark eine Spitzenleistung erzielt. Wir stellen zudem Ergebnisse einer detaillierten Ablationsstudie vor, die den Beitrag jeder Komponente zur Gesamtleistung verdeutlicht.

Regenbogen: Kombination von Verbesserungen im tiefen Reinforcement Learning | Neueste Forschungsarbeiten | HyperAI