11일 전

소수 샘플 객체 탐지를 위한 메타 대비 학습을 통한 계층적 주의망

Dongwoo Park, Jong-Min Lee
소수 샘플 객체 탐지를 위한 메타 대비 학습을 통한 계층적 주의망
초록

소샷 객체 탐지(FSOD)는 새로운 카테고리의 이미지가 몇 장뿐인 경우에도 이를 분류하고 탐지하는 것을 목표로 한다. 기존의 메타학습 방법은 구조적 한계로 인해 지원 이미지와 쿼리 이미지 간의 특징을 충분히 활용하지 못한다. 본 연구에서는 순차적으로 큰 수용 영역을 갖춘 계층적 주의망(hierarchical attention network)을 제안하여 쿼리 이미지와 지원 이미지의 특징을 극대화한다. 또한 메타학습은 지원 이미지와 쿼리 이미지가 일치하는지 여부를 판단함으로써 카테고리를 충분히 구분하지 못한다. 즉, 분류를 위한 메트릭 기반 학습은 직접적인 효과를 발휘하지 못한다. 따라서 메타학습 전략의 목적을 직접적으로 달성하는 데 도움을 주는 대조 학습 기법인 메타-대조 학습(meta-contrastive learning)을 제안한다. 최종적으로, 뚜렷한 경계를 확보함으로써 새로운 최고 성능의 네트워크를 구축하였다. 제안한 방법은 COCO 데이터셋에서 1~30샷 객체 탐지에 대해 각각 2.3%, 1.0%, 1.3%, 3.4%, 2.4%의 AP 향상을 가져왔다. 코드는 다음 링크에서 공개되어 있다: https://github.com/infinity7428/hANMCL