9일 전
컨텍스트 인지형 블록 네트워크를 활용한 소형 객체 탐지
{Mingliang Xu, Ling Shao, Luming Zhang, Bing Zhou, Zhimin Gao, Xiaoheng Jiang, Pei Lv, Lisha Cui}
초록
최신의 객체 탐지기들은 일반적으로 입력 이미지를 점진적으로 다운샘플링하여 작은 특징 맵으로 표현하는 방식을 사용한다. 그러나 이러한 방식은 공간 정보를 상실하게 되어 소형 객체의 표현 능력을 저하시킨다. 본 논문에서는 고해상도 및 강력한 의미적 특징 맵을 구축함으로써 소형 객체 탐지 성능을 향상시키기 위해, 맥락 인식 블록 네트워크(Context-aware Block Net, CAB Net)를 제안한다. 고공간 해상도 특징 맵의 표현 능력을 내부적으로 강화하기 위해, 정교하게 설계된 맥락 인식 블록(Context-aware Block, CAB)을 도입한다. CAB는 다단계 맥락 정보를 포함하기 위해 피라미드형 확장 합성곱(pyramidal dilated convolutions)을 활용하면서도 특징 맵의 원래 해상도를 유지한다. 이후, 상대적으로 낮은 다운샘플링 비율(예: 8)을 가진 절단된 백본 네트워크(예: VGG16)의 끝부분에 CAB를 연결하고, 이후 모든 계층은 제거한다. CAB Net은 소형 객체의 기본 시각적 패턴뿐 아니라 의미 정보까지 효과적으로 포착할 수 있어, 소형 객체 탐지 성능을 크게 향상시킨다. 기준 데이터셋인 Tsinghua-Tencent 100K 및 Airport 데이터셋에서 수행된 실험 결과, CAB Net은 실시간 속도를 유지하면서도 다른 최고 성능을 기록하는 탐지기들보다 크게 우수한 성능을 보여주었으며, 이는 CAB Net이 소형 객체 탐지에 매우 효과적임을 입증한다.