2달 전

무지개: 딥 강화 학습의 개선 결합

Matteo Hessel; Joseph Modayil; Hado van Hasselt; Tom Schaul; Georg Ostrovski; Will Dabney; Dan Horgan; Bilal Piot; Mohammad Azar; David Silver

논문 세부 정보 보기

초록

딥 강화학습 커뮤니티는 DQN 알고리즘에 대해 여러 독립적인 개선을 이루어냈습니다. 그러나 이러한 확장 기법들이 상호 보완적이며 효과적으로 결합될 수 있는지 여부는 명확하지 않습니다. 본 논문에서는 DQN 알고리즘의 여섯 가지 확장 기법을 검토하고, 이들의 결합을 실증적으로 연구합니다. 실험 결과, 결합된 기법은 Atari 2600 벤치마크에서 데이터 효율성과 최종 성능 측면에서 최고 수준의 성능을 제공함을 확인하였습니다. 또한, 각 구성 요소가 전체 성능에 미치는 영향을 보여주는 자세한 제거 연구(Ablation Study) 결과도 제시합니다.