
현대 객체 탐지기의 훈련에서 중요한 병목 현상 중 하나는 이미지 내 각 객체에 대해 경계 박스(annotation)를 수동으로 생성해야 하는 라벨링된 이미지의 필요성이다. 이 병목 현상은 특히 고해상도 공중 이미지에서 더욱 심화되며, 여기서는 작고 빈번히 군집된 객체들을 라벨링해야 하기 때문이다. 최근에는 가짜 라벨(pseudo-label)과 약한-강한 증강 일관성(weak-strong augmentation consistency)을 활용한 메인티처(mean-teacher) 기반의 반감독 학습 방식이 반감독 객체 탐지 분야에서 점점 인기를 끌고 있다. 그러나 이러한 반감독 탐지기들을 작고 군집된 객체가 흔한 공중 이미지에 직접 적용할 경우, 최적의 성능을 기대하기 어렵다. 본 논문에서는 훈련 중에 작고 군집된 객체의 위치를 식별하고, 이를 활용하여 추론 단계에서 성능을 향상시키는 밀도 쿠프(density crop) 유도형 반감독 탐지기를 제안한다. 훈련 과정에서 라벨링된 이미지와 라벨링되지 않은 이미지에서 식별된 군집 영역의 이미지 쿠프를 사용하여 훈련 데이터를 증강함으로써, 작고 작은 객체 탐지 가능성을 높이고, 라벨링되지 않은 이미지에서의 작고 작은 객체에 대한 고품질 가짜 라벨 생성을 촉진한다. 추론 시에는 관심 객체를 탐지하는 것뿐만 아니라, 작고 작은 객체가 고밀도로 분포한 영역(밀도 쿠프)도 식별하여 입력 이미지의 탐지 결과와 쿠프 영역의 탐지 결과를 결합함으로써, 특히 작은 객체에 대해 전체적으로 더 정확한 예측이 가능하게 된다. VisDrone 및 DOTA와 같은 주요 벤치마크에서 수행한 실험 결과는 제안하는 밀도 쿠프 유도형 반감독 탐지기가 기존 메인티처 기반 방법에 비해 COCO 스타일의 AP 기준으로 평균 2% 이상의 성능 향상을 보임을 입증한다. 본 논문의 코드는 다음 주소에서 공개되어 있다: https://github.com/akhilpm/DroneSSOD.