2ヶ月前

レインボウ:深層強化学習の改善を組み合わせる

Matteo Hessel; Joseph Modayil; Hado van Hasselt; Tom Schaul; Georg Ostrovski; Will Dabney; Dan Horgan; Bilal Piot; Mohammad Azar; David Silver
レインボウ:深層強化学習の改善を組み合わせる
要約

深層強化学習コミュニティはDQNアルゴリズムに対していくつかの独立した改善を行ってきました。しかし、これらの拡張が互いに補完的であるかどうか、そして効果的に組み合わせることができるかどうかは明確ではありません。本論文では、DQNアルゴリズムの6つの拡張を検討し、それらの組み合わせについて実証的に研究を行いました。実験結果は、データ効率と最終的な性能の両面でAtari 2600ベンチマークにおいて最先端の性能を達成していることを示しています。また、詳細なアブレーションスタディの結果も提供しており、各コンポーネントが全体的な性能に与える貢献度を明らかにしています。