12일 전
새에 대한 소형 객체 탐지: Swin Transformer를 활용한 방법
{Ichiro Ide, Takahiro Komamizu, Takatsugu Hirayama, Yasutomo Kawanishi, TingWei Liu, Marc A. Kastner, Da Huo}
초록
객체 탐지는 이미지 내 객체를 탐지하는 작업이다. 이 작업에서 특히 어려운 것은 소형 객체의 탐지이다. 소형 객체는 크기 외에도 흐림, 가림, 그리고 기타 다양한 요인으로 인해 탐지가 어렵다. 현재의 소형 객체 탐지 기법들은 주로 소형이면서 밀집된 상황에 특화되어 있다. 예를 들어, 인파 속의 보행자나 원격 탐사 환경에서의 멀리 있는 객체 등이 이에 해당한다. 그러나 타깃 객체가 소형이면서 희박한 경우, 학습에 사용 가능한 객체가 부족하여 효과적인 특징을 학습하기 더욱 어려운 문제가 있다. 본 논문에서는 특정 카테고리의 소형 객체, 즉 조류를 탐지하기 위한 전용 방법을 제안한다. 특히, 백본과 예측 헤드 사이에 위치한 네크(neck) 부분에서 학습되는 특징을 개선하여 계층적인 설계를 통해 더 효과적인 특징을 학습하도록 한다. 본 연구에서는 Swin Transformer를 활용하여 이미지 특징을 업샘플링하고, 소형 객체에 적합하도록 시프트된 윈도우 크기를 조정한다. 실험 결과, 제안하는 Swin Transformer 기반의 네크와 CenterNet을 결합함으로써 윈도우 크기 조정을 통해 우수한 성능을 달성할 수 있음을 확인하였다. 또한, 더 작은 윈도우 크기(기본값 2)가 소형 객체 탐지에 있어 mAP를 향상시키는 데 유리함을 발견하였다.