2달 전
깊이 있는 이미지 검색: 이미지 검색을 위한 전역 표현 학습
Albert Gordo; Jon Almazan; Jerome Revaud; Diane Larlus

초록
우리는 인스턴스 수준 이미지 검색을 위한 새로운 접근 방식을 제안합니다. 이 방법은 각 이미지를 위해 많은 지역별 설명자를 집계하여 전역적이고 컴팩트한 고정 길이 표현을 생성합니다. 기존 연구에서는 사전 학습된 딥 네트워크를 특징 생성에 사용하는 블랙박스로 활용하였으나, 우리의 방법은 이미지 검색이라는 특정 작업을 위해 훈련된 딥 아키텍처를 활용합니다. 우리의 기여는 두 가지입니다: (i) 순위 결정 프레임워크를 활용하여 지역 특징을 구축하기 위해 사용되는 합성곱 및 투영 가중치를 학습합니다; (ii) 지역 제안 네트워크를 사용하여 최종 전역 설명자를 형성하기 위해 어떤 지역들이 풀링되어야 하는지를 학습합니다. 우리는 깨끗한 훈련 데이터의 사용이 우리 접근 방식의 성공에 중요한 역할을 한다는 것을 보여줍니다. 이를 위해 대규모이지만 노이즈가 있는 랜드마크 데이터셋과 자동 정제 방법을 개발하였습니다. 제안된 아키텍처는 단일 순방향 패스에서 전역 이미지 표현을 생성합니다. 우리의 접근 방식은 표준 데이터셋에서 전역 설명자 기반의 이전 접근 방식들을 크게 능가하며, 비용이 많이 드는 로컬 설명자 색인화 및 공간 검증 기반의 대부분 이전 연구들보다도 우수한 성능을 보입니다. 추가 자료는 www.xrce.xerox.com/Deep-Image-Retrieval에서 확인할 수 있습니다.