
초록
다중 라벨 이미지 인식은 실용적인 컴퓨터 비전 과제로 알려져 있으며 도전적입니다. 그러나 이 분야의 발전은 종종 복잡한 방법, 무거운 계산, 그리고 직관적인 설명 부족으로 특징지어집니다. 우리는 다양한 범주에 속하는 객체가 차지하는 서로 다른 공간 영역을 효과적으로 포착하기 위해 매우 간단한 모듈인 클래스 특화 잔차 주의(Class-Specific Residual Attention, CSRA)를 제안합니다. CSRA는 간단한 공간 주의 점수를 제안하여 각 범주별로 클래스 특화 피처를 생성하고, 이를 클래스 무관 평균 풀링 피처와 결합합니다. CSRA는 다중 라벨 인식에서 최신 기술 수준의 결과를 달성하며 동시에 이들보다 훨씬 간단합니다. 또한 CSRA는 추가 학습 없이도 4줄의 코드만으로 다양한 사전 학습된 모델과 데이터셋에서 일관된 개선을 가져옵니다. CSRA는 구현이 쉽고 계산량이 적으며, 직관적인 설명과 시각화도 가능합니다.