17일 전
MnasFPN: 모바일 장치에서 객체 탐지용 지연 시간 인지 피라미드 아키텍처 학습
Bo Chen, Golnaz Ghiasi, Hanxiao Liu, Tsung-Yi Lin, Dmitry Kalenichenko, Hartwig Adams, Quoc V. Le

초록
자원 제약 환경에서 시각 작업을 위한 아키텍처 탐색 기술이 빠르게 성장하고 있음에도 불구하고, 디바이스 내 객체 탐지 아키텍처 설계는 여전히 주로 수작업에 의존하고 있다. 일부 자동 탐색 연구들은 모바일 친화적인 탐색 공간을 중심으로 하지 않거나, 디바이스 내 지연 시간을 고려하지 않는 경우가 많다. 본 연구에서는 탐지 헤드를 위한 모바일 친화적인 탐색 공간인 MnasFPN을 제안하고, 지연 시간을 고려한 아키텍처 탐색 기법과 결합하여 효율적인 객체 탐지 모델을 설계한다. 학습된 MnasFPN 헤드는 MobileNetV2 본체와 조합되었을 때, Pixel 기기에서 유사한 지연 시간에서 MobileNetV3+SSDLite보다 1.8 mAP 높은 성능을 달성한다. 또한 NAS-FPNLite보다 1.0 mAP 높은 정확도와 10% 빠른 속도를 보이며, 전반적인 효율성에서 우수한 성능을 발휘한다. 제거 실험 결과에 따르면, 성능 향상의 대부분은 탐색 공간 내 혁신적인 설계에서 비롯된다. 추가적인 탐색을 통해 탐색 공간 설계와 탐색 알고리즘 간의 흥미로운 상관관계를 발견하였으며, MnasFPN 탐색 공간의 복잡성은 국소 최적점에 있을 가능성이 있음을 시사한다.