2달 전

WILDCAT: 이미지 분류, 점별 위치 추정 및 세그멘테이션을 위한 깊은 ConvNet의 약한 지도 학습

{Nicolas Thome, Taylor Mordan, Matthieu Cord, Thibaut Durand}
WILDCAT: 이미지 분류, 점별 위치 추정 및 세그멘테이션을 위한 깊은 ConvNet의 약한 지도 학습
초록

이 논문은 이미지 영역 간의 정렬을 통해 공간 불변성(spatial invariance)을 확보하고, 강하게 국소화된 특징을 학습하는 것을 공동 목적으로 하는 딥러닝 기법인 WILDCAT을 제안한다. 본 모델은 전역 이미지 레이블만을 사용하여 학습되며, 이미지 분류, 약한 감독 하의 객체 위치 추정(weakly supervised object localization), 그리고 의미 세분화(semantic segmentation)라는 세 가지 주요 시각 인식 작업에 활용된다. WILDCAT은 기존 최고 수준의 컨볼루션 신경망(Convolutional Neural Networks)을 세 가지 주요 차원에서 확장한다. 첫째, 공간 해상도를 유지하기 위해 완전 컨볼루션 네트워크(Fully Convolutional Networks)를 활용하는 점이며, 둘째, 다양한 클래스 모달리티(class modalities)와 관련된 국소적 특징을 네트워크 내에서 명시적으로 설계한 점이며, 셋째, 이러한 특징들을 새로운 방식으로 풀링하여 약한 감독 학습에 요구되는 전역 이미지 예측을 제공하는 점이다. 광범위한 실험 결과를 통해 본 모델이 기존 최고 수준의 방법들을 크게 능가함을 입증하였다.