2달 전

원샷 객체 검출을 위한 공동 주의 및 공동 흥분

Ting-I Hsieh; Yi-Chen Lo; Hwann-Tzong Chen; Tyng-Luh Liu
원샷 객체 검출을 위한 공동 주의 및 공동 흥분
초록

본 논문은 일회성 객체 검출(one-shot object detection)의 어려운 문제를 해결하는 것을 목표로 한다. 학습 데이터에 포함되지 않은 클래스 라벨을 가진 쿼리 이미지 패치가 주어질 때, 이 작업의 목표는 대상 이미지에서 해당 클래스의 모든 인스턴스를 검출하는 것이다. 이를 위해 우리는 세 가지 핵심 기술적 측면에서 기여하는 새로운 {\em 공동 주의 및 공동 흥분} (CoAE) 프레임워크를 개발하였다.첫째, 비국소(non-local) 연산을 사용하여 각 쿼리-대상 쌍에 내재된 공동 주의를 탐색하고 일회성 상황을 고려한 영역 제안(region proposals)을 생성한다. 둘째, 압축 및 공동 흥분(squeeze-and-co-excitation) 방식을 제시하여 관련된 특징 채널을 적응적으로 강조하여 관련 제안과 궁극적으로 대상 객체를 찾아내는 데 도움을 준다. 셋째, 마진 기반 순위 손실(margin-based ranking loss)을 설계하여 학습 과정에서 보이거나 보이지 않는 클래스 라벨에 관계없이 쿼리와 영역 제안 사이의 유사성을 예측하기 위한 메트릭을 암묵적으로 학습한다.결과적으로 본 모델은 두 단계 검출기로, VOC와 MS-COCO 데이터셋에서 일회성 설정으로 보이는 클래스와 처음 보는 클래스 모두로부터 객체를 검출하는 강력한 베이스라인 성능을 보여준다. 코드는 https://github.com/timy90022/One-Shot-Object-Detection 에서 확인할 수 있다.

원샷 객체 검출을 위한 공동 주의 및 공동 흥분 | 최신 연구 논문 | HyperAI초신경