2달 전
다중 글로벌 디스크립터의 조합을 이용한 이미지 검색
HeeJae Jun; Byungsoo Ko; Youngjoon Kim; Insik Kim; Jongtack Kim

초록
최근의 이미지 검색 작업 연구에서는 다양한 모델을 앙상블하고 여러 개의 전역 설명자를 결합하면 성능 향상이 이루어짐을 보여주었습니다. 그러나 앙상블을 위한 다른 모델들을 훈련시키는 것은 시간과 메모리 측면에서 어려울 뿐만 아니라 비효율적입니다. 본 논문에서는 앙상블 효과를 얻으면서도 엔드투엔드 방식으로 훈련할 수 있는 새로운 프레임워크를 제안합니다. 제안된 프레임워크는 전역 설명자, CNN 백본, 손실 함수, 데이터셋에 따라 유연하고 확장 가능합니다. 또한, 우리는 정량적 및 정성적 분석을 통해 여러 개의 전역 설명자를 결합하는 효과를 조사하였습니다. 우리의 광범위한 실험 결과는 결합된 설명자가 다양한 종류의 특성 속성을 활용할 수 있어 단일 전역 설명자보다 우수한 성능을 발휘함을 보여줍니다. 벤치마크 평가에서 제안된 프레임워크는 CARS196, CUB200-2011, In-shop Clothes, Stanford Online Products 등의 이미지 검색 작업에서 최고 수준의 성능을 달성하였습니다. 우리의 모델 구현 및 사전 학습된 모델은 공개적으로 이용 가능합니다.