17일 전

정밀 시각 분류를 위한 점진적 코주의망

Tian Zhang, Dongliang Chang, Zhanyu Ma, Jun Guo
정밀 시각 분류를 위한 점진적 코주의망
초록

미세한 시각 분류(Fine-grained visual classification)는 동일한 카테고리 내에 존재하는 여러 하위 카테고리의 이미지를 식별하는 것을 목표로 한다. 이는 매우 유사한 카테고리 간에 내재된 미세한 차이들로 인해 매우 도전적인 과제이다. 기존의 대부분의 방법들은 단일 이미지만을 입력으로 사용하기 때문에, 모델이 서로 다른 이미지들 간의 대비적 특징을 인식하는 능력에 한계가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 점진적 공동 주의망(Progressive Co-Attention Network, PCA-Net)이라는 효과적인 방법을 제안한다. 구체적으로, 동일 카테고리 내 이미지 쌍 간의 특징 채널 간 상호작용을 유도함으로써 채널별 유사도를 계산하여 공통적인 구분 특징을 포착한다. 또한, 보완적인 정보가 인식에 중요함을 고려하여, 채널 상호작용으로 인해 강화된 주목 영역을 제거함으로써 네트워크가 다른 구분 가능한 영역에 집중하도록 유도한다. 제안한 모델은 CUB-200-2011, Stanford Cars, FGVC Aircraft 세 가지 미세한 시각 분류 기준 데이터셋에서 경쟁력 있는 성능을 달성하였다.

정밀 시각 분류를 위한 점진적 코주의망 | 최신 연구 논문 | HyperAI초신경