11일 전

약한 감독 객체 탐지를 위한 종합적 주의력 자기-distillation

Zeyi Huang, Yang Zou, Vijayakumar Bhagavatula, Dong Huang
약한 감독 객체 탐지를 위한 종합적 주의력 자기-distillation
초록

약한 감독 객체 탐지(Weakly Supervised Object Detection, WSOD)는 이미지 수준의 카테고리 레이블만을 사용하여 객체 탐지기 모델을 학습하는 데 효과적인 도구로 부상하고 있다. 그러나 객체 수준의 레이블이 없기 때문에 WSOD 탐지기는 주목할 만한 객체, 군집된 객체, 그리고 특징적인 객체 부분에 대해 경계 상자(Bounding Box)를 탐지하는 경향이 있다. 더불어 이미지 수준의 카테고리 레이블은 동일한 이미지에 대한 다양한 변환에 걸쳐 일관된 객체 탐지를 강제하지 못한다. 이러한 문제를 해결하기 위해 본 연구에서는 WSOD를 위한 종합적 주의(Self-Distillation) 자기학습(Comprehensive Attention Self-Distillation, CASD) 기법을 제안한다. CASD는 동일한 이미지에 대한 여러 변환과 다양한 특징 레이어에서 수집된 종합적 주의를 계산함으로써, 모든 객체 인스턴스 간의 특징 학습을 균형 있게 유지한다. 또한, 객체에 대한 일관된 공간적 감독을 강화하기 위해 WSOD 네트워크 내에서 자기학습(self-distillation)을 수행함으로써, 동일한 이미지의 여러 변환과 특징 레이어가 동시에 종합적 주의를 근사하도록 유도한다. 제안된 CASD는 PASCAL VOC 2007/2012 및 MS-COCO와 같은 표준 벤치마크에서 새로운 최고 성능(SOTA)의 WSOD 결과를 달성하였다.