2달 전

깊은 합성곱 특성을 활용한 이미지 검색

Artem Babenko; Victor Lempitsky
깊은 합성곱 특성을 활용한 이미지 검색
초록

최근의 여러 연구들은 깊은 합성곱 신경망(deep convolutional neural networks)이 생성하는 이미지 설명자가 이미지 분류 및 검색 문제에서 최고 수준의 성능을 제공함을 보여주었습니다. 또한 합성곱 층(convolutional layers)의 활성화가 특정 이미지 영역을 설명하는 국소 특징(local features)으로 해석될 수 있음이 입증되었습니다. 이러한 국소 특징은 국소 특징을 위한 집계 방법(예: Fisher 벡터)을 사용하여 집계할 수 있으며, 이로써 새로운 강력한 전역 설명자(global descriptors)를 제공할 수 있습니다.본 논문에서는 이미지 검색을 위해 국소 깊은 특징(local deep features)을 집계하여 소형화된 전역 설명자를 생성하기 위한 가능한 방법들을 조사합니다. 먼저, 깊은 특징과 전통적인 인공 설계 특징(hand-engineered features) 간에 쌍별 유사도(pairwise similarities)의 분포가 상당히 다르다는 점을 보여줍니다. 따라서 기존의 집계 방법들이 신중하게 재평가되어야 함을 알 수 있습니다. 이러한 재평가는 얕은 특징(shallow features)과 달리, 합Pooling(sum pooling) 기반의 단순 집계 방법이 깊은 합성곱 특징(deep convolutional features)에 대해 가장 우수한 성능을 제공한다는 사실을 밝혔습니다. 이 방법은 효율적이며, 매개변수가 적고, 예를 들어 PCA 행렬을 학습할 때 과적합(overfitting) 위험이 적습니다. 전체적으로, 새로운 소형화된 전역 설명자는 네 가지 일반적인 벤치마크에서 현 상태 최고 수준의 성능을 크게 개선했습니다.