17일 전
네, 요청하신 내용을 기준으로 한국어로 번역하여 드리겠습니다. 네 가지 GPU 시간 내에 강건한 신경망 아키텍처 탐색하기
Xuanyi Dong, Yi Yang

초록
전통적인 신경망 아키텍처 탐색(NAS) 방법은 강화 학습 또는 진화 전략에 기반을 두고 있으며, CIFAR-10에서 우수한 모델을 찾기 위해 3000개 이상의 GPU 시간이 소요된다. 본 연구에서는 경사 하강법을 활용한 효율적인 NAS 접근법을 제안한다. 제안하는 방법은 탐색 공간을 방향성 비순환 그래프(DAG)로 표현한다. 이 DAG는 수십억 개의 부분 그래프를 포함하며, 각 부분 그래프는 특정한 신경망 아키텍처를 나타낸다. 부분 그래프의 모든 가능성을 탐색하는 것을 피하기 위해, 우리는 DAG 위에서 미분 가능한 샘플러를 개발하였다. 이 샘플러는 학습된 샘플 아키텍처의 검증 손실을 기반으로 학습 가능하며 최적화된다. 이를 통해 본 방법은 경사 하강법을 통해 종단 간(end-to-end)으로 학습이 가능하며, 이를 '미분 가능한 아키텍처 샘플러를 활용한 경사 기반 탐색(GDAS)'이라 명명한다. 실험 결과, CIFAR-10에서 하나의 탐색 과정을 단 4개의 GPU 시간 내에 완료할 수 있었으며, 발견된 모델은 단 250만 개의 파라미터로 테스트 오차 2.82%를 달성하여 최신 기술 수준과 동등한 성능을 보였다. 코드는 GitHub에서 공개되어 있으며, 다음 링크에서 확인할 수 있다: https://github.com/D-X-Y/NAS-Projects.