2달 전
Auto-DeepLab: 의미 있는 이미지 분할을 위한 계층적 신경망 구조 탐색
Chenxi Liu; Liang-Chieh Chen; Florian Schroff; Hartwig Adam; Wei Hua; Alan Yuille; Li Fei-Fei

초록
최근, 신경망 구조 탐색(Neural Architecture Search, NAS)은 대규모 이미지 분류에서 인간이 설계한 신경망 구조를 능가하는 구조를 성공적으로 식별하였습니다. 본 논문에서는 의미론적 이미지 분할을 위한 NAS를 연구합니다. 기존 연구들은 주로 반복 가능한 셀 구조의 탐색에 초점을 맞추고 있으며, 공간 해상도 변화를 제어하는 외부 네트워크 구조는 수작업으로 설계하는 경향이 있습니다. 이러한 선택은 탐색 공간을 단순화하지만, 네트워크 레벨 구조의 다양성이 더욱 많은 밀집 이미지 예측에 대해 점점 더 문제가 되고 있습니다. 따라서, 우리는 셀 레벨 구조뿐만 아니라 네트워크 레벨 구조도 탐색하도록 제안하며, 이는 계층적인 구조 탐색 공간을 형성합니다. 우리는 많은 인기 있는 설계를 포함하는 네트워크 레벨 탐색 공간을 제시하고, 효율적인 그래디언트 기반 구조 탐색을 가능하게 하는 공식화 방법을 개발하였습니다(시티스케이프 이미지에서 3개의 P100 GPU를 사용하여 1일 소요).우리는 제안된 방법의 효과성을 도전적인 시티스케이프(Cityscapes), PASCAL VOC 2012, ADE20K 데이터셋에서 입증하였습니다. 의미론적 이미지 분할에 특화된 우리의 구조인 Auto-DeepLab은 ImageNet 사전 학습 없이 최신 수준의 성능을 달성하였습니다.