2달 전
다중 레이블 이미지 분류를 위한 약하게 지도된 검출에서의 지식 증류
Yongcheng Liu; Lu Sheng; Jing Shao; Junjie Yan; Shiming Xiang; Chunhong Pan

초록
다중 라벨 이미지 분류는 일반적인 시각적 이해를 위한 기본적이지만 도전적인 과제입니다. 기존 방법들은 지역 수준의 힌트(예: RoI에서 추출한 특징)가 다중 라벨 분류를 촉진할 수 있음을 발견했습니다. 그러나 이러한 방법은 일반적으로 효과적인 객체 수준의 시각적 특징 학습을 위해 번거로운 객체 수준 주석(즉, 객체 라벨과 바운딩 박스)이 필요합니다. 본 논문에서는 바운딩 박스 주석 없이 약간 감독된 검출 작업에서 지식을 추출하여 다중 라벨 분류를 강화하는 새로운이고 효율적인 딥 프레임워크를 제안합니다. 구체적으로, 이미지 수준의 주석이 주어진 경우, (1) 먼저 약간 감독된 검출(WSD) 모델을 개발하고, 그 다음 (2) 전체 이미지에 대한 클래스 수준 예측과 객체 RoI에 대한 객체 수준 시각적 특징에 따라 WSD 모델에 의해 안내되는 지식 증류 모듈을 포함한 엔드투엔드 다중 라벨 이미지 분류 프레임워크를 구성합니다. WSD 모델은 교사 모델이며, 분류 모델은 학생 모델입니다. 이 크로스-태스크 지식 증류 이후, 분류 모델의 성능은 크게 향상되며, 테스트 단계에서 WSD 모델을 안전하게 폐기할 수 있으므로 효율성도 유지됩니다. MS-COCO와 NUS-WIDE 두 대규모 데이터셋에 대한 광범위한 실험 결과, 제안된 프레임워크는 성능과 효율성 모두에서 최신 방법론들을 능가하는 우수한 성능을 보였습니다.