2달 전

M2Det: 다중 수준 피라미드 네트워크 기반의 단일 샷 객체 검출기

Qijie Zhao; Tao Sheng; Yongtao Wang; Zhi Tang; Ying Chen; Ling Cai; Haibin Ling
M2Det: 다중 수준 피라미드 네트워크 기반의 단일 샷 객체 검출기
초록

특성 피라미드는 객체 인스턴스 간 크기 변동으로 인한 문제를 완화하기 위해 최신의 단일 단계 객체 검출기(예: DSSD, RetinaNet, RefineDet)와 두 단계 객체 검출기(예: Mask R-CNN, DetNet)에서 널리 활용되고 있습니다. 이러한 특성 피라미드를 사용하는 객체 검출기는 희망적인 결과를 얻고 있지만, 실제로 객체 분류 작업을 위해 설계된 백본의 고유한 다중 스케일, 피라미드 구조에 따라 단순히 특성 피라미드를 구성하기 때문에 몇 가지 제한이 존재합니다. 최근 본 연구에서는 다양한 크기의 객체 검출을 위한 더 효과적인 특성 피라미드를 구성하는 방법인 다단계 특성 피라미드 네트워크(Multi-Level Feature Pyramid Network, MLFPN)를 제안합니다. 첫째, 백본에서 추출된 다단계 특성을(즉, 여러 층을) 기반 특성으로 융합합니다. 둘째, 기반 특성을 교대적으로 연결된 Thinned U-shape 모듈과 특성 융합 모듈의 블록에 입력하고 각 U-shape 모듈의 디코더 층을 객체 검출을 위한 특성으로 활용합니다. 마지막으로, 동일한 스케일(크기)의 디코더 층들을 모아서 객체 검출용 특성 피라미드를 개발하며, 이때 각각의 특성 맵은 여러 단계에서 추출된 층(특성)들로 구성됩니다. 제안된 MLFPN의 효과성을 평가하기 위해 SSD 아키텍처에 통합하여 강력한 엔드투엔드 단일 단계 객체 검출기인 M2Det를 설계 및 학습하였습니다. 이를 통해 M2Det는 최신의 단일 단계 검출기에 비해 더 우수한 검출 성능을 보여주었습니다. 특히 MS-COCO 벤치마크에서 M2Det는 단일 스케일 추론 전략을 사용할 때 11.8 FPS 속도로 AP 41.0을 달성하였으며, 다중 스케일 추론 전략을 사용할 때는 AP 44.2를 달성하였습니다. 이는 단일 단계 검출기 중 새로운 최신 성과입니다. 코드는 \url{https://github.com/qijiezhao/M2Det}에서 제공될 예정입니다.