거시적에서 미시적까지의 제안 생성 및 모방 학습을 통한 소형 객체 탐지

최근 몇 년간 객체 탐지 분야는 막대한 성과를 거두었으나, 현재의 우수한 탐지기들은 크기 제한된 객체를 다루는 데 어려움을 겪고 있다. 구체적으로, 사전(anchors)과 객체 영역 간의 낮은 겹침률(proposal-object overlap) 문제는 최적화를 위한 표본 풀(sample pool)을 제한하며, 구분 능력이 떨어지는 정보의 부족은 인식 성능을 더욱 악화시킨다. 이러한 문제를 완화하기 위해, '거시적에서 미시적' 접근 방식과 특징 모방 학습(Feature Imitation learning)을 기반으로 한 이단계 프레임워크인 CFINet을 제안한다. 먼저, 동적 앵커 선택 전략과 연쇄 회귀(cascade regression)를 통해 소형 객체에 대해 충분하고 고품질의 후보 영역(proposals)을 보장하는 '거시적에서 미시적 RPN(CRPN)'을 도입한다. 이후 기존 탐지 헤드에 특징 모방(FI) 브랜치를 추가하여, 크기 제한으로 인해 모델이 어려움을 겪는 영역 표현을 모방 방식으로 보완한다. 더불어, 감독형 대조 학습(supervised contrastive learning) 프레임워크를 따르는 부가적 모방 손실(auxiliary imitation loss)를 설계하여 이 브랜치를 최적화한다. Faster RCNN과 통합했을 때, CFINet은 대규모 소형 객체 탐지 벤치마크인 SODA-D 및 SODA-A에서 최신 기준(SOTA) 성능을 달성하며, 기준 탐지기 및 기타 주류 탐지 기법들에 비해 뛰어난 성능을 입증한다.