17일 전
세밀한 이미지 인식을 위한 선택적 희소 샘플링
{ Jianbin Jiao, Qixiang Ye, Yi Zhu, Yanzhao Zhou, Yao Ding}

초록
미세한 차이 인식은 동일한 클래스 내에서 큰 변동성(예: 새 종의 부리 형태)이 존재하는 상황에서 미묘한 클래스 간 차이를 포착하는 고유한 도전 과제를 제기한다. 기존의 접근 방식은 지역적인 영역을 자르고 그 영역에서 세부적인 표현을 학습하지만, 고정된 부분 수와 주변 맥락의 누락이라는 한계를 가진다. 본 논문에서는 다양한 미세한 세부 정보를 효과적으로 포착할 수 있는 간단하면서도 효과적인 프레임워크인 ‘선택적 희소 샘플링(Selective Sparse Sampling)’을 제안한다. 이 프레임워크는 컨볼루션 신경망을 기반으로 구현되며, 이를 ‘선택적 희소 샘플링 네트워크(S3N, Selective Sparse Sampling Networks)’라 칭한다. 이미지 수준의 지도 정보를 활용하여 S3N은 클래스 반응 맵에서 피크(즉, 국소 최댓값)를 수집함으로써 정보가 풍부한 수용 영역을 추정하고, 미세한 시각적 증거를 포착하면서 맥락을 유지할 수 있는 희소 주의 메커니즘을 학습한다. 이러한 증거는 선택적으로 샘플링되어 구분력이 강하고 상호 보완적인 특징을 추출하며, 이는 학습된 표현을 크게 풍부하게 하고 네트워크가 더 미묘한 특징을 탐지하도록 안내한다. 광범위한 실험 및 아블레이션 연구를 통해 제안된 방법이 CUB-200-2011, FGVC-Aircraft, Stanford Cars와 같은 도전적인 벤치마크에서 최신 기술을 일관되게 초월함을 확인하였다.