
초록
소수 샘플 객체 탐지(Few-shot object detection, FSOD)는 적은 수의 학습 예시를 통해 미지 클래스에 대해 탐지기의 적응을 가능하게 하며, 수동 주석 작업이 시간이 많이 소요되거나 데이터 수집이 제한되는 상황에서 유용하다. 기존의 접근 방식들은 소수 샘플 분류 기술을 활용하여 FSOD를 촉진하는 데 초점을 맞추었지만, 본 연구는 특유의 샘플 분포로 인해 도전적인 스케일 변동 문제를 다루는 것이 필수적임을 강조한다. 이를 위해 우리는 FSOD에서 객체 스케일을 풍부하게 하는 다중 스케일 양성 샘플 정제(Multi-scale Positive Sample Refinement, MPSR) 방법을 제안한다. 이 방법은 객체 피라미드 형태의 다중 스케일 양성 샘플을 생성하고, 다양한 스케일에서 예측을 정제한다. 우리는 이 기법을 FPN을 갖춘 대표적인 아키텍처인 Faster R-CNN에 보조 브랜치로 통합함으로써 강력한 FSOD 솔루션을 제시한다. PASCAL VOC 및 MS COCO 데이터셋에서 수행한 여러 실험을 통해 제안한 방법이 최신 기술 수준의 성능을 달성하며, 기존 대안들에 비해 유의미하게 뛰어난 결과를 보였으며, 그 효과성을 입증하였다. 코드는 https://github.com/jiaxi-wu/MPSR 에서 공개되어 있다.