DPNet: 실시간 객체 탐지에 적합한 경량 주의 메커니즘을 갖춘 이중 경로 네트워크

최근 고정밀도 합성곱 신경망(CNN)의 압축 기술은 실시간 객체 탐지 분야에서 두드러진 진전을 보여왔다. 탐지 속도를 향상시키기 위해 경량 탐지기는 일반적으로 단일 경로 백본을 사용하며, 이로 인해 합성곱 계층 수가 적다. 그러나 단일 경로 아키텍처는 지속적인 풀링 및 다운샘플링 연산을 수반하며, 이로 인해 객체 위치 추정에 불리한 저해상도이자 정확도가 낮은 특징 맵을 생성한다. 한편, 제한된 네트워크 용량으로 인해 최근의 경량 네트워크는 대규모 시각 데이터를 효과적으로 표현하는 데 어려움을 겪는다. 이러한 문제를 해결하기 위해 본 논문은 실시간 객체 탐지를 위한 경량 주의 메커니즘을 갖춘 이중 경로 네트워크인 DPNet을 제안한다. 이중 경로 아키텍처는 고수준 의미 특징과 저수준 객체 세부 정보를 병렬로 추출할 수 있도록 한다. DPNet은 단일 경로 탐지기와 거의 유사한 구조를 갖지만, 계산 비용과 모델 크기는 크게 증가하지 않는다. 표현 능력을 강화하기 위해, 전역 상호작용을 효과적으로 포착할 수 있는 경량 자기상관 모듈(LSCM)을 설계하였으며, 이는 낮은 계산 부담과 적은 네트워크 파라미터를 갖는다. 네트워크의 중간 부분(neck)에서는 LSCM을 확장하여 이웃한 다중 스케일 특징 간의 상호 의존성을 포착하는 경량 교차상관 모듈(LCCM)을 도입한다. 본 연구는 MS COCO 및 Pascal VOC 2007 데이터셋에서 광범위한 실험을 수행하였다. 실험 결과, DPNet은 탐지 정확도와 구현 효율성 사이에서 최첨단의 균형을 달성함을 입증하였다. 구체적으로, DPNet은 MS COCO test-dev에서 30.5%의 AP, Pascal VOC 2007 test set에서 81.5%의 mAP를 기록하였으며, 모델 크기는 약 2.5M, 연산량은 1.04 GFLOPs, 입력 이미지 크기가 320×320인 경우 각각 164 FPS와 196 FPS의 추론 속도를 달성하였다.