
초록
이미지 지오로케일라이제이션(geolocalization), 즉 이미지의 지리적 위치를 추론하는 것은 많은 잠재적인 응용 분야를 가진 도전적인 컴퓨터 비전 문제입니다. 이 문제에 대한 최근 최신 접근 방식은 세계를 공간적으로 셀(cell)로 나누고 주어진 이미지에 대해 올바른 셀을 예측하도록 깊은 네트워크를 훈련시키는 깊은 이미지 분류 접근 방식입니다. 우리는 이 접근 방식을 기존의 Im2GPS 접근 방식과 결합하여 제안합니다. Im2GPS 접근 방식에서는 질의 이미지를 지리적 태그가 부여된 이미지 데이터베이스와 매칭하고 검색된 집합에서 위치를 추론합니다. 우리는 참조 데이터베이스에서 질의 이미지의 가장 가까운 이웃들의 위치에 커널 밀도 추정(kernel density estimation)을 적용하여 질의 이미지의 지리적 위치를 추정합니다. 흥미롭게도, 우리는 테스트 시 분류 접근 방식을 사용하지 않더라도, 분류 손실(classification loss)로 훈련된 네트워크에서 파생된 특징들이 우리의 검색 작업에 가장 좋은 특징임을 발견했습니다. 분류 손실로 훈련하는 것이 검색 응용 프로그램에서 더 일반적으로 사용되는 여러 깊은 특징 학습 방법(예: 대조 또는 삼중 손실(contrastive or triplet loss)을 사용한 Siamese 네트워크)보다 우수한 성능을 보였습니다. 우리의 간단한 접근 방식은 최신 지오로케일라이제이션 정확도를 달성하면서 동시에 훨씬 적은 훈련 데이터를 필요로 합니다.