2달 전

다중 라벨 이미지 인식을 위한 그래프 컨볼루션 네트워크

Chen, Zhao-Min ; Wei, Xiu-Shen ; Wang, Peng ; Guo, Yanwen
다중 라벨 이미지 인식을 위한 그래프 컨볼루션 네트워크
초록

다중 라벨 이미지 인식의 목표는 이미지에 나타난 객체 라벨들의 집합을 예측하는 것이다. 객체들이 일반적으로 이미지에서 함께 등장하기 때문에, 라벨 간의 의존성을 모델링하여 인식 성능을 향상시키는 것이 바람직하다. 이러한 중요한 의존성을 포착하고 탐색하기 위해, 우리는 그래프 컨볼루셔널 네트워크(GCN) 기반의 다중 라벨 분류 모델을 제안한다. 이 모델은 각 노드(라벨)가 라벨의 워드 임베딩으로 표현되는 객체 라벨 위에 방향성 그래프를 구축하며, GCN은 이 라벨 그래프를 상호 의존적인 객체 분류기들의 집합으로 매핑하도록 학습된다. 이러한 분류기는 다른 서브넷에서 추출된 이미지 설명자들에 적용되어 전체 네트워크가 엔드투엔드로 학습될 수 있도록 한다. 또한, 우리는 효과적인 라벨 상관 행렬을 생성하여 GCN 내 노드들 사이의 정보 전달을 안내하는 새로운 재가중 방안을 제안한다. 두 개의 다중 라벨 이미지 인식 데이터셋에 대한 실험 결과는 우리의 접근법이 기존 최신 방법들을 명백히 능가함을 보여준다. 더불어 시각화 분석은 우리의 모델에서 학습된 분류기가 의미 있는 сем마틱 토폴로지를 유지함을 밝혀냈다.