17일 전

강화학습 에이전트의 신경망 아키텍처 최적화

N. Mazyavkina, S. Moustafa, I. Trofimov, E. Burnaev
강화학습 에이전트의 신경망 아키텍처 최적화
초록

강화학습(RL)은 최근 몇 년간 상당한 발전을 이뤘다. 그 중 가장 중요한 전진 단계 중 하나는 신경망의 광범위한 적용이었다. 그러나 이러한 신경망의 아키텍처는 일반적으로 수동적으로 설계된다. 본 연구에서는 강화학습 에이전트의 아키텍처를 최적화하기 위해 최근 제안된 신경망 아키텍처 탐색(NAS) 기법을 탐구한다. 우리는 아타리 벤치마크에서 실험을 수행한 결과, 현대적인 NAS 기법이 수동적으로 선택된 아키텍처를 초월하는 강화학습 에이전트의 아키텍처를 발견함을 확인하였다.