초록
이 연구의 목적은 대규모 이미지 데이터셋에서 이미지 쿼리로 지정된 객체를 검색하는 것으로, 검색은 Video Google [28]과 같이 런타임 시 즉각적으로 수행되어야 한다. 본 연구는 다음과 같은 세 가지 기여를 한다: (i) 처리 및 저장 요구량을 증가시키지 않으면서도 우수한 성능을 보이는 새로운 SIFT 기술자 비교 방법(RootSIFT); (ii) 역색인을 효율적으로 활용하여 즉각적인 검색에 적합한 형태로 쿼리에 대한 보다 풍부한 모델을 구분적으로 학습하는 쿼리 확장 기법; (iii) Turcot과 Lowe [29]이 제안한 이미지 증강 방법의 개선으로, 증강된 이미지와 공간적으로 일관성을 갖는 특징만을 유지하는 방식. 본 연구는 Oxford Buildings 5k 및 105k, Paris 6k 등 여러 표준 벤치마크 데이터셋을 대상으로 이 세 가지 방법을 평가하였으며, 즉각적인 검색 속도를 유지하면서 검색 성능이 상당히 향상됨을 입증하였다. 이러한 보완적인 방법들을 결합함으로써, 해당 데이터셋에서 새로운 최고 성능(최신 기준)을 달성하였다.