3달 전

메타 전략과 명시적 위치 추론을 통한 즉시 반응형 소수 샘플 객체 탐지

Junying Huang, Fan Chen, Sibo Huang, Dongyu Zhang
메타 전략과 명시적 위치 추론을 통한 즉시 반응형 소수 샘플 객체 탐지
초록

새로운 카테고리의 객체를 소수의 참조 샘플을 통해 인식하고 위치를 파악하는 것을 목표로 하는 소수 샘플 객체 탐지(FSOD, Few-Shot Object Detection)는 매우 도전적인 과제이다. 기존의 연구들은 일반적으로 모델을 새로운 카테고리에 맞게 미세조정(fine-tuning)하는 방식에 의존하며, 미세조정의 한계를 거의 고려하지 않아 다양한 응용 상황에서의 문제를 야기한다. 예를 들어, 미세조정 횟수가 과도하게 많아지는 에피소드가 변경 가능한 환경에서는 성능이 만족스럽지 못하며, 저품질(예: 낮은 샘플 수 및 클래스 불완전성)의 지원 세트(Support Set)에서의 성능 역시 크게 저하된다. 이를 해결하기 위해 본 논문은 미세조정 과정 없이도 새로운 카테고리의 객체를 정확하고 즉각적으로 탐지할 수 있는 즉각 반응 소수 샘플 객체 탐지기(IR-FSOD, Instant Response Few-Shot Object Detector)를 제안한다. 이 목적을 달성하기 위해, 먼저 FSOD 설정 하에서 Faster R-CNN 프레임워크 내 각 모듈의 단점을 철저히 분석한 후, 이러한 단점을 보완함으로써 IR-FSOD로 확장하였다. 구체적으로, 박스 분류기와 RPN 모듈에 대해 간단하면서도 효과적인 메타 전략 두 가지를 제안하여 새로운 카테고리 객체 탐지에 대한 즉각적인 반응을 가능하게 하였다. 또한, 위치 추정 모듈의 기본 카테고리에 대한 과적합 문제를 완화하기 위해, 명시적 위치 점수(explicit localization score)와 반명시적 박스 회귀(semi-explicit box regression)라는 두 가지 명시적 추론 방식을 도입하였다. 광범위한 실험 결과는 IR-FSOD 프레임워크가 즉각적인 반응을 통해 소수 샘플 객체 탐지를 달성할 뿐만 아니라, 다양한 FSOD 설정 하에서 정밀도와 재현율 측면에서 최신 기준(SOTA, State-of-the-Art) 성능을 달성함을 보여주었다.

메타 전략과 명시적 위치 추론을 통한 즉시 반응형 소수 샘플 객체 탐지 | 연구 논문 | HyperAI초신경