메타 전략과 명시적 위치 추론을 통한 즉시 반응형 소수 샘플 객체 탐지

새로운 카테고리의 객체를 소수의 참조 샘플을 통해 인식하고 위치를 파악하는 것을 목표로 하는 소수 샘플 객체 탐지(FSOD, Few-Shot Object Detection)는 매우 도전적인 과제이다. 기존의 연구들은 일반적으로 모델을 새로운 카테고리에 맞게 미세조정(fine-tuning)하는 방식에 의존하며, 미세조정의 한계를 거의 고려하지 않아 다양한 응용 상황에서의 문제를 야기한다. 예를 들어, 미세조정 횟수가 과도하게 많아지는 에피소드가 변경 가능한 환경에서는 성능이 만족스럽지 못하며, 저품질(예: 낮은 샘플 수 및 클래스 불완전성)의 지원 세트(Support Set)에서의 성능 역시 크게 저하된다. 이를 해결하기 위해 본 논문은 미세조정 과정 없이도 새로운 카테고리의 객체를 정확하고 즉각적으로 탐지할 수 있는 즉각 반응 소수 샘플 객체 탐지기(IR-FSOD, Instant Response Few-Shot Object Detector)를 제안한다. 이 목적을 달성하기 위해, 먼저 FSOD 설정 하에서 Faster R-CNN 프레임워크 내 각 모듈의 단점을 철저히 분석한 후, 이러한 단점을 보완함으로써 IR-FSOD로 확장하였다. 구체적으로, 박스 분류기와 RPN 모듈에 대해 간단하면서도 효과적인 메타 전략 두 가지를 제안하여 새로운 카테고리 객체 탐지에 대한 즉각적인 반응을 가능하게 하였다. 또한, 위치 추정 모듈의 기본 카테고리에 대한 과적합 문제를 완화하기 위해, 명시적 위치 점수(explicit localization score)와 반명시적 박스 회귀(semi-explicit box regression)라는 두 가지 명시적 추론 방식을 도입하였다. 광범위한 실험 결과는 IR-FSOD 프레임워크가 즉각적인 반응을 통해 소수 샘플 객체 탐지를 달성할 뿐만 아니라, 다양한 FSOD 설정 하에서 정밀도와 재현율 측면에서 최신 기준(SOTA, State-of-the-Art) 성능을 달성함을 보여주었다.