3달 전
비정책 강화학습을 활용한 효율적이고 효과적인 GAN 아키텍처 탐색
Yuan Tian, Qin Wang, Zhiwu Huang, Wen Li, Dengxin Dai, Minghao Yang, Jun Wang, Olga Fink

초록
본 논문에서는 효과적이고 효율적인 생성적 적대 신경망(GAN) 아키텍처 탐색을 위한 새로운 강화학습(RL) 기반의 신경망 아키텍처 탐색(NAS) 방법론을 제안한다. 핵심 아이디어는 GAN 아키텍처 탐색 문제를 매끄러운 아키텍처 샘플링을 가능하게 하기 위해 마르코프 결정 과정(MDP)으로 공식화하는 것이다. 이를 통해 잠재적인 전역 최적 아키텍처를 타깃으로 하는 더 효과적인 RL 기반 탐색 알고리즘을 구현할 수 있다. 효율성을 향상시키기 위해, 이전 정책이 생성한 샘플을 효율적으로 활용하는 오프폴리시(Off-policy) GAN 아키텍처 탐색 알고리즘을 도입하였다. CIFAR-10과 STL-10이라는 두 가지 표준 벤치마크 데이터셋에서의 평가 결과, 제안하는 방법은 상당히 감소된 계산 부담(7 GPU 시간)으로 우수한 이미지 생성 성능을 달성하는 경쟁력 있는 아키텍처를 탐색할 수 있음을 입증하였다. 본 연구의 코드는 https://github.com/Yuantian013/E2GAN 에서 공개되어 있다.