9일 전

컨텍스트 인지형 블록 네트워크를 활용한 소형 객체 탐지

{Mingliang Xu, Ling Shao, Luming Zhang, Bing Zhou, Zhimin Gao, Xiaoheng Jiang, Pei Lv, Lisha Cui}
초록

최신의 객체 탐지기들은 일반적으로 입력 이미지를 점진적으로 다운샘플링하여 작은 특징 맵으로 표현하는 방식을 사용한다. 그러나 이러한 방식은 공간 정보를 상실하게 되어 소형 객체의 표현 능력을 저하시킨다. 본 논문에서는 고해상도 및 강력한 의미적 특징 맵을 구축함으로써 소형 객체 탐지 성능을 향상시키기 위해, 맥락 인식 블록 네트워크(Context-aware Block Net, CAB Net)를 제안한다. 고공간 해상도 특징 맵의 표현 능력을 내부적으로 강화하기 위해, 정교하게 설계된 맥락 인식 블록(Context-aware Block, CAB)을 도입한다. CAB는 다단계 맥락 정보를 포함하기 위해 피라미드형 확장 합성곱(pyramidal dilated convolutions)을 활용하면서도 특징 맵의 원래 해상도를 유지한다. 이후, 상대적으로 낮은 다운샘플링 비율(예: 8)을 가진 절단된 백본 네트워크(예: VGG16)의 끝부분에 CAB를 연결하고, 이후 모든 계층은 제거한다. CAB Net은 소형 객체의 기본 시각적 패턴뿐 아니라 의미 정보까지 효과적으로 포착할 수 있어, 소형 객체 탐지 성능을 크게 향상시킨다. 기준 데이터셋인 Tsinghua-Tencent 100K 및 Airport 데이터셋에서 수행된 실험 결과, CAB Net은 실시간 속도를 유지하면서도 다른 최고 성능을 기록하는 탐지기들보다 크게 우수한 성능을 보여주었으며, 이는 CAB Net이 소형 객체 탐지에 매우 효과적임을 입증한다.

컨텍스트 인지형 블록 네트워크를 활용한 소형 객체 탐지 | 최신 연구 논문 | HyperAI초신경