11일 전
소수 샘플 객체 탐지를 위한 이중 인지 주의 메커니즘
Tung-I Chen, Yueh-Cheng Liu, Hung-Ting Su, Yu-Cheng Chang, Yu-Hsiang Lin, Jia-Fong Yeh, Wen-Chin Chen, Winston H. Hsu

초록
최근의 발전은 소수 샘플 분류(few-shot classification, FSC) 성능을 크게 향상시켰지만, 소수 샘플 객체 탐지(few-shot object detection, FSOD)는 현대 학습 시스템에게 여전히 도전 과제로 남아 있다. 기존의 FSOD 시스템들은 FSC 접근 방식을 그대로 따르며, 공간적 변동성과 불확실한 표현과 같은 핵심 문제를 간과하고 있어 낮은 성능을 초래한다. 이러한 문제를 인식하고, 우리는 네트워크가 주어진 서포트 이미지를 적응적으로 해석할 수 있도록 하는 새로운 \textbf{이중 인지 주의(Dual-Awareness Attention, DAnA)} 메커니즘을 제안한다. DAnA는 서포트 이미지를 \textbf{쿼리 위치 인지}(query-position-aware, QPA) 특징으로 변환하여, 쿼리 이미지의 각 지역에 맞춤형 서포트 정보를 할당함으로써 탐지 네트워크의 정확한 안내를 가능하게 한다. 또한 제안된 DAnA 구성 요소는 기존의 여러 객체 탐지 프레임워크에 유연하게 통합 가능하며, 특별히 소수 샘플 학습을 위해 설계되지 않은 전통적인 객체 탐지 네트워크인 Faster R-CNN과 RetinaNet도 DAnA를 도입함으로써 FSOD 작업에서 최신 기술 수준의 성능을 달성한다. 기존 방법과 비교하여, 본 모델은 다양한 평가 환경에서 성능을 47\% (+6.9 AP) 크게 향상시켜 뛰어난 성능을 입증한다.