보조 셀을 통한 컴팩트한 의미 분할 모델의 신경망 구조 검색 가속화

특정 작업에 맞춤화된 신경망 아키텍처의 자동 설계는 매우 유망하지만 본질적으로 어려운 연구 방향입니다. 이 분야에서 대부분의 성과는 이미지 분류와 언어 모델링 문제를 통해 이루어졌지만, 여기서는 특히 완전 합성곱 네트워크(fully convolutional networks)를 사용한 의미적 이미지 세그멘테이션과 같은 밀집형 픽셀 단위 작업에 집중합니다. 위에서 언급한 영역들과 달리, 완전 합성곱 네트워크의 설계 선택은 사용해야 하는 연산 종류(예: 희소화된 합성곱(dilated convolutions))부터 더 어려운 최적화 문제 해결까지 여러 가지 변경을 필요로 합니다. 본 연구에서는 실시간으로 작동하면서 제한된 리소스를 사용할 수 있는 고성능 컴팩트 세그멘테이션 아키텍처를 탐색하는 데 특히 관심을 두고 있습니다. 이를 위해 우리는 훈련 시에 보조 셀(auxiliary cells)을 통해 중간 감독 신호를 제공하고, 평가 단계에서는 생략할 수 있도록 고의적으로 과매개변수화(over-parameterise)하였습니다. 보조 셀의 설계는 강화 학습을 사용하여 훈련된 고정 구조의 컨트롤러(controller) 신경망에서 생성됩니다. 더욱 중요한 점은, 제한된 시간과 계산 리소스 내에서 이러한 아키텍처를 효율적으로 탐색하는 방법을 보여주는 것입니다. 특히, 추가적인 훈련이 불필요한 아키텍처를 조기에 종료시키는 진보적인 전략(progressive strategy)과 Polyak 평균화(Polyak averaging) 및 지식 증류(knowledge distillation)를 결합하여 수렴 속도를 높이는 방법에 의존합니다. 정량적으로, 8 GPU-일 동안 우리의 접근법은 의미적 세그멘테이션, 포즈 추정(pose estimation), 깊이 예측(depth prediction) 작업에서 소형 모델(compact models) 중 최신 기술(state-of-the-art)과 비슷한 성능을 내는 여러 아키텍처들을 발견하였습니다. 코드는 다음 주소에서 제공될 예정입니다: https://github.com/drsleep/nas-segm-pytorch