17일 전

한 번의 예시를 통한 자기 평가 템플릿 네트워크를 이용한 신경망 아키텍처 탐색

Xuanyi Dong, Yi Yang
한 번의 예시를 통한 자기 평가 템플릿 네트워크를 이용한 신경망 아키텍처 탐색
초록

뉴럴 아키텍처 서치(Neural Architecture Search, NAS)는 수동적인 아키텍처 설계 대신, 아키텍처 탐색 과정을 자동화하는 것을 목표로 한다. 최근의 NAS 접근법은 검색 과정을 며칠 내에 완료할 수 있지만, 특정 아키텍처 후보에 대해 정확한 평가를 위해 매개변수를 얻기 위해 여전히 긴 학습 과정이 필요하다. 최근 제안된 원샷 NAS(One-shot NAS) 방법들은 후보 간에 매개변수를 공유함으로써 이 지루한 학습 과정을 크게 단축시키고자 한다. 이를 통해 각 후보에 대한 매개변수를 처음부터 학습하는 대신, 공유된 매개변수에서 직접 추출할 수 있다. 그러나 이러한 방법들은 평가 전까지 어떤 후보가 더 나은 성능을 보일지에 대한 판단 기준이 없기 때문에, 후보들은 무작위로 샘플링되며, 그 중 상위 1위 후보만 최고의 후보로 간주하게 된다. 본 논문에서는 평가 대상 아키텍처 후보의 품질을 향상시켜 경쟁력 있는 후보를 더 잘 포함할 수 있도록 하는 자기 평가 템플릿 네트워크(Self-Evaluated Template Network, SETN)를 제안한다. SETN은 두 가지 구성 요소로 이루어져 있다. (1) 평가기(Evaluator): 각 개별 아키텍처가 낮은 검증 손실을 가질 가능성을 나타내는 확률을 학습한다. 이를 바탕으로 평가 대상 후보를 평가기의 판단에 따라 선택적으로 샘플링할 수 있다. (2) 템플릿 네트워크(Template Network): 모든 후보 간에 매개변수를 공유함으로써 생성된 후보들의 학습 비용을 분산시킨다. 실험 결과, SETN이 탐색한 아키텍처는 CIFAR 및 ImageNet 벤치마크에서 기존 최고 성능을 달성하였으며, 계산 비용은 비교 가능한 수준을 유지하였다. 코드는 GitHub에서 공개되어 있다: https://github.com/D-X-Y/AutoDL-Projects.

한 번의 예시를 통한 자기 평가 템플릿 네트워크를 이용한 신경망 아키텍처 탐색 | 최신 연구 논문 | HyperAI초신경