
초록
본 논문에서는 시각적 유사성을 포착하기 위해 이미지의 임베딩을 학습하는 깊은 컨볼루션 신경망을 제안합니다. 우리는 긍정적 및 부정적 이미지 쌍으로 훈련된 깊은 시아메즈(Siamese) 구조를 제시하며, 이 구조는 시각적 유사성 순위에 따라 이미지를 정확하게 순위화하는 임베딩을 학습합니다. 또한 문제의 요구사항에 따라 각도 기반 손실 메트릭스(angular loss metrics)를 사용한 새로운 손실 계산 방법을 구현했습니다. 이미지의 최종 임베딩은 하위 및 상위 레벨 임베딩의 결합된 표현입니다. n차원 공간에서 학습된 임베딩 간의 거리는 분수 거리 행렬(fractional distance matrix)을 사용하여 계산되었습니다. 마지막으로, 네 개의 데이터셋에서 구조를 테스트하여 본 연구가 이미지 검색 측면에서 다른 기존의 깊은 구조보다 우수함을 입증하였습니다. 또한 우리가 제안한 네트워크가 미세한 이미지 유사성을 포착하기 위해 사용되는 전통적인 깊은 CNNs보다 최적의 임베딩을 학습함으로써 더 나은 성능을 보이는 방법을 설명하였습니다.