18일 전
가우시안 혼합 모델 지향적 구분 학습을 통한 약한 감독 하의 미세 분류 이미지 분류
{ Zezhou Li, Jianjun Li, Haojie Li, Shuhui Yang, Shijie Wang, Zhihui Wang}

초록
기존의 약한 감독 하의 미세한 분류 이미지 인식(WFGIR) 방법들은 일반적으로 고수준 특징 맵에서 구분 가능한 영역을 직접 추출한다. 본 연구에서는 컨볼루션 신경망이 국소적 수용장(Receptive Field)의 겹침 연산을 통해 고수준 특징 맵에서 구분 가능한 영역이 확산되는 현상을 발견하였으며, 이로 인해 구분 가능한 영역의 정확한 위치 추정이 어려워진다는 문제를 제기한다. 본 논문에서는 이러한 구분 가능한 영역의 확산 문제를 해결하고, 더 정밀한 미세한 특징을 탐지하기 위해 엔드 투 엔드 형태의 구분 가능한 특징 지향 가우시안 혼합 모델(DF-GMM)을 제안한다. 구체적으로 DF-GMM은 다음과 같은 두 가지 핵심 구성 요소로 이루어져 있다. 1) 저랭크 표현 기반(LRM): 고수준 의미 특징 맵에서 가우시안 혼합 모델(GMM)을 이용하여 저랭크 구분 가능한 기저(base)들을 학습함으로써 특징 표현의 구분 능력을 향상시킨다. 2) 저랭크 표현 재구성 기반(LR²M): 저랭크 구분 가능한 기저에 대응하는 공간 정보를 복원하여 저랭크 특징 맵을 재구성함으로써 구분 가능한 영역의 확산 문제를 완화하고, 보다 정밀한 위치 추정을 가능하게 한다. 광범위한 실험 결과를 통해 DF-GMM이 CUB-Bird, Stanford-Cars, FGVC Aircraft 데이터셋에서 동일한 설정 하에 기존의 최고 수준의 접근법들과 비교해 가장 우수한 성능을 보임을 확인하였다.