17일 전

EAutoDet: 객체 탐지를 위한 효율적인 아키텍처 탐색

Xiaoxing Wang, Jiale Lin, Junchi Yan, Juanping Zhao, Xiaokang Yang
EAutoDet: 객체 탐지를 위한 효율적인 아키텍처 탐색
초록

객체 탐지용 CNN을 훈련하는 데는 대규모 데이터셋과 복잡한 네트워크 모듈로 인해 시간이 오래 걸리며, 이로 인해 탐지 데이터셋에서 직접 아키텍처를 탐색하는 것이 어렵다. 일반적으로 이러한 탐색은 막대한 비용(일반적으로 수십에서 수백 개의 GPU-일)을 수반한다. 반면 본 논문은 실용적인 백본 및 FPN 아키텍처를 1.4 GPU-일 내에 탐색할 수 있는 효율적인 프레임워크인 EAutoDet을 제안한다. 구체적으로, 백본과 FPN 모듈 모두에 대해 슈퍼넷을 구축하고, 미분 가능(differentiable)한 방법을 채택한다. GPU 메모리 요구량과 계산 비용을 줄이기 위해, 한 간선 상의 후보 연산들의 가중치를 공유하고 이를 하나의 합성곱 연산으로 통합하는 커널 재사용 기법을 제안한다. 또한 채널 수를 탐색하기 위해 동적 채널 정교화 전략(dynamic channel refinement strategy)을 도입한다. 광범위한 실험을 통해 제안한 방법의 뛰어난 효율성과 효과성을 입증하였다. 특히, 탐색된 아키텍처는 기존 최고 수준의 객체 탐지용 NAS 방법을 능가하며, COCO test-dev 세트에서 120 FPS로 40.1 mAP, 41.3 FPS로 49.2 mAP의 성능을 달성하였다. 또한, 탐색된 아키텍처를 회전 객체 탐지 작업에 전이 적용한 결과, DOTA-v1.0 테스트 세트에서 21.1M 파라미터로 77.05 mAP$_{\text{50}}$의 성능을 기록하였다.