F2DNet: 보행자 검출을 위한 빠른 초점 검출 네트워크

이중 단계 탐지기(detection)는 객체 탐지 및 보행자 탐지 분야에서 최신 기술로 인정받고 있다. 그러나 현재의 이중 단계 탐지기는 영역 제안 네트워크(region proposal network, RPN)와 경계 상자 헤드(bounding box head)에서 다수의 단계를 거쳐 경계 상자 회귀(bounding box regression)를 수행함에 따라 효율성이 낮은 문제가 있다. 또한 앵커 기반의 영역 제안 네트워크는 학습 과정에서 계산적으로 매우 비효율적이다. 본 연구에서는 기존 이중 단계 탐지기의 중복성을 제거하기 위해 영역 제안 네트워크를 제안하는 포칼 탐지 네트워크(focal detection network)로 대체하고, 경계 상자 헤드를 빠른 억제 헤드(fast suppression head)로 교체한 새로운 이중 단계 탐지 아키텍처인 F2DNet을 제안한다. F2DNet은 최고 수준의 보행자 탐지 데이터셋에서 성능을 평가하였으며, 기존 최신 기술 대비 철저한 비교 분석을 수행하였고, 다양한 데이터셋 간의 평가를 통해 모델의 일반화 성능을 검증하였다. 단일 데이터셋에서 학습한 F2DNet은 City Persons, Caltech Pedestrian, Euro City Persons 데이터셋에서 각각 8.7%, 2.2%, 6.1%의 MR-2를 달성하였으며, 점진적 미세 조정(progressive fine-tuning)을 활용할 경우 Caltech Pedestrian 및 City Persons 데이터셋의 중대한 가림 상황(heavy occlusion)에서 각각 20.4%와 26.2%의 MR-2를 기록하였다. 또한 기존 최신 기술 대비 뚜렷하게 짧은 추론 시간을 보였다. 코드 및 학습된 모델은 https://github.com/AbdulHannanKhan/F2DNet 에 공개될 예정이다.