
초록
모델 효율성은 컴퓨터 비전 분야에서 점점 더 중요한 주제가 되고 있다. 본 논문에서는 객체 탐지에 적합한 신경망 아키텍처 설계 선택을 체계적으로 연구하고, 효율성을 향상시키기 위한 몇 가지 핵심 최적화 기법을 제안한다. 첫째, 간편하고 빠른 다중 스케일 특징 병합이 가능한 가중치가 부여된 양방향 특징 피라미드 네트워크(Weighted Bi-directional Feature Pyramid Network, BiFPN)를 제안한다. 둘째, 백본, 특징 네트워크, 박스/클래스 예측 네트워크의 해상도, 깊이, 너비를 동시에 균일하게 확장하는 복합 스케일링(Compound Scaling) 방법을 제안한다. 이러한 최적화 기법과 더 나은 백본 아키텍처를 기반으로, 기존 기법 대비 다양한 자원 제약 조건에서 뛰어난 효율성을 지닌 새로운 객체 탐지기인 EfficientDet이라는 신규 가족을 개발하였다. 특히 단일 모델 및 단일 스케일 조건에서 EfficientDet-D7은 COCO test-dev에서 55.1 AP를 달성하며, 파라미터 수 77M, 연산량 410B FLOPs로 기존 탐지기 대비 4배에서 9배 작고, FLOPs는 13배에서 42배 적게 사용한다. 코드는 https://github.com/google/automl/tree/master/efficientdet 에서 공개되어 있다.