2달 전

CNN 이미지 검색이 BoW에서 배우다: 어려운 예제를 사용한 비지도 세부 조정

Filip Radenović; Giorgos Tolias; Ondřej Chum
CNN 이미지 검색이 BoW에서 배우다: 어려운 예제를 사용한 비지도 세부 조정
초록

컨벌루션 신경망(CNNs)은 많은 컴퓨터 비전 작업에서 최고 수준의 성능을 달성하고 있습니다. 그러나 이 성과는 스크래치에서 학습하거나 대상 작업에 대한 미세 조정(fine-tuning)을 수행하기 위해 극단적인 수작업 주석이 필요합니다. 본 연구에서는 대규모 무순서 이미지 컬렉션에서 이미지 검색을 위한 완전 자동화된 방식으로 CNN을 미세 조정하는 방법을 제안합니다. 우리는 최신 검색 및 모션으로부터 구조(Structure-from-Motion, SfM) 방법을 사용하여 3D 모델을 얻고, 이를 통해 CNN 미세 조정에 사용될 훈련 데이터의 선택을 안내합니다. 우리는 특히 컴팩트 코드를 사용한 개별 객체 검색에서, 어려운 양성 예제와 어려운 음성 예제가 최종 성능을 향상시킨다는 것을 보여줍니다.