
초록
깊은 해싱(deep hashing)은 유사성 데이터로부터 깊은 표현과 해시 코드를 엔드투엔드로 학습하여 효율적이고 효과적인 이미지 검색을 구현합니다. 본 연구에서는 유사성 검색에서 해싱 솔루션보다 우수한 성능을 보인 딥 러닝 기반 양자화 접근법에 초점을 맞춘 컴팩트 코딩 솔루션을 제시합니다. 우리는 유사성 트리플렛(similarity triplets)으로부터 깊은 양자화 모델을 학습하는 새로운 방법론인 딥 트리플렛 양자화(Deep Triplet Quantization, DTQ)를 제안합니다. 더 효과적인 트리플렛 훈련을 위해 그룹 하드(Group Hard)라는 새로운 트리플렛 선택 방법론을 설계하였습니다. 이 방법론은 각 이미지 그룹에서 무작위로 어려운 트리플렛(hard triplets)을 선택합니다. 컴팩트한 바이너리 코드 생성을 위해, 트리플렛 훈련 중 약한 직교성을 가진 트리플렛 양자화를 추가로 적용하였습니다. 양자화 손실은 코드북의 중복성을 줄이고 역전파(back-propagation)를 통해 깊은 표현의 양자화 가능성을 향상시킵니다. 광범위한 실험 결과, DTQ는 고품질의 컴팩트한 바이너리 코드를 생성할 수 있으며, 이는 NUS-WIDE, CIFAR-10, MS-COCO 세 개의 벤치마크 데이터셋에서 최고 수준의 이미지 검색 성능을 달성하였습니다.