2달 전
세부 사항에서 악마를 찾다: 세밀한 이미지 인식을 위한 삼차원 주의 샘플링 네트워크 학습
Heliang Zheng; Jianlong Fu; Zheng-Jun Zha; Jiebo Luo

초록
미세하지만 차별화된 특징(예: 새의 부리와 눈)을 학습하는 것은 세부적인 이미지 인식에서 중요한 역할을 합니다. 기존의 주의력 기반 접근 방식은 주요 부분을 정위하고 강화하여 미세한 세부 사항을 학습하지만, 이는 종종 제한된 수의 부분과 높은 계산 비용으로 인해 어려움을 겪습니다. 본 논문에서는 효율적인 교사-학생 방식으로 Trilinear Attention Sampling Network(TASN)을 통해 수백 개의 부분 제안에서 이러한 미세한 특징을 학습하는 방법을 제안합니다. 구체적으로, TASN은 1) 채널 간 관계를 모델링하여 주의 맵을 생성하는 삼선형 주의 모듈, 2) 고해상도로 주목받는 부분을 강조하는 주의력 기반 샘플러, 그리고 3) 가중치 공유와 특징 보존 전략을 통해 부분 특징을 전역 특징으로 추출하는 특징 디스틸러로 구성됩니다. 광범위한 실험 결과가 iNaturalist-2017, CUB-Bird, Stanford-Cars 데이터셋에서 TASN이 가장 경쟁력 있는 접근 방식들과 동일한 설정 하에 최고의 성능을 나타냄을 확인하였습니다.