Meta-DETR: 클래스 간 상관관계 탐색을 통한 이미지 수준의 소량 샘플 객체 탐지

소수 샘플 객체 탐지(few-shot object detection)는 영역 기반 탐지 프레임워크에 메타학습을 통합함으로써 광범위하게 연구되어 왔다. 비록 성공적인 결과를 거두고 있으나, 해당 접근 방식은 다음과 같은 여러 제약 요인에 의해 제한된다: (i) 새로운 클래스에 대한 저품질의 영역 제안(region proposals), 그리고 (ii) 서로 다른 클래스 간의 클래스 간 상관관계를 무시하는 점이다. 이러한 한계는 기존 클래스의 지식을 새로운 클래스 객체 탐지에 일반화하는 데 방해가 된다. 본 연구에서는 DETR 기반 탐지 프레임워크에 메타학습을 위한 상관관계 집계(correlational aggregation)를 통합한 새로운 소수 샘플 탐지 프레임워크인 Meta-DETR를 제안한다. Meta-DETR는 영역 제안 없이 이미지 수준에서 완전히 동작하므로, 기존 소수 샘플 탐지 프레임워크에서 흔히 발생하는 정확도가 낮은 제안 문제를 회피할 수 있다. 또한 Meta-DETR는 단일 순방향 전파(feed-forward) 과정에서 여러 지원 클래스(support classes)를 동시에 주목할 수 있다. 이러한 독창적인 설계는 서로 다른 클래스 간의 상관관계를 효과적으로 포착할 수 있게 하여, 유사한 클래스 간의 오분류를 크게 감소시키고, 새로운 클래스로의 지식 일반화 능력을 향상시킨다. 다양한 소수 샘플 객체 탐지 벤치마크에서 수행된 실험 결과, 제안된 Meta-DETR는 최신 기술(SOTA) 방법들을 크게 능가함을 보였다. 구현 코드는 https://github.com/ZhangGongjie/Meta-DETR 에 공개될 예정이다.