17일 전
SR-GNN: 세부 이미지 분류를 위한 공간 관계 인지 그래프 신경망
Asish Bera, Zachary Wharton, Yonghuai Liu, Nik Bessis, Ardhendu Behera

초록
최근 몇 년 동안 딥 컨볼루션 신경망(CNN) 기반의 이미지 인식 분야에서 상당한 진전이 이루어졌다. 이는 이러한 네트워크가 텍스처와 형태로부터 구분 가능한 객체의 자세 및 부분 정보를 효과적으로 추출할 수 있는 강력한 능력 덕분이다. 그러나 이는 오브젝트의 부분이 가려짐, 왜곡, 조명 변화 등의 영향으로 인해 내부 클래스(variance)는 높고, 외부 클래스 간 차이가 낮은 특성(고해상도 시각 분류, FGVC)에는 적합하지 않을 수 있다. 따라서 객체나 장면을 정확히 특성화하기 위해서는 전반적인 구조적 정보를 잘 설명할 수 있는 표현력 있는 특징 표현이 핵심이다. 이를 달성하기 위해, 경계 박스나 구분 가능한 부분에 대한 레이블 없이도, 가장 관련성이 높은 이미지 영역들로부터 맥락 인식 특징을 집계하고, 그 중요도를 고려하여 미세한 변화를 효과적으로 포착하는 방법을 제안한다. 본 연구는 최근의 자기 주의(self-attention) 및 그래프 신경망(GNN) 기법의 발전에서 영감을 받아, 간단하면서도 효과적인 관계 인식 특징 변환을 도입하고, 맥락 인식 주의 메커니즘을 활용하여 특징 변환 과정을 개선함으로써, 엔드 투 엔드 학습 환경에서 변환된 특징의 구분 능력을 향상시킨다. 제안된 모델은 고해상도 객체와 인간-객체 상호작용을 포함한 8개의 벤치마크 데이터셋에서 평가되었으며, 인식 정확도에서 최신 기술 대비 유의미한 성능 향상을 보였다.