2달 전

표본 추출이 딥 임베딩 학습에서 중요하다

Chao-Yuan Wu; R. Manmatha; Alexander J. Smola; Philipp Krähenbühl
표본 추출이 딥 임베딩 학습에서 중요하다
초록

깊은 임베딩(deep embeddings)은 한 가지 간단한 질문에 답합니다: 두 이미지가 얼마나 유사한가? 이러한 임베딩을 학습하는 것은 검증, 제로샷 학습(zero-shot learning), 그리고 시각적 검색의 기반이 됩니다. 가장 주목받는 접근 방식들은 대조 손실(contrastive loss) 또는 삼중 손실(triplet loss)과 같은 적절한 손실 함수를 사용하여 깊은 컨볼루션 네트워크를 최적화하는 것입니다. 그러나 많은 연구들이 손실 함수에만 집중한다면, 본 논문에서는 훈련 예제 선택이 동등하게 중요한 역할을 한다는 것을 보여줍니다. 우리는 정보량이 많고 안정적인 예제를 전통적인 접근 방식보다 더 잘 선택하는 거리 가중 샘플링(distance weighted sampling)을 제안합니다. 또한, 단순한 마진 기반 손실(margin based loss)이 모든 다른 손실 함수를 능가하기에 충분하다는 것을 보여줍니다. 우리는 이미지 검색 및 클러스터링을 위한 스탠퍼드 온라인 제품(Stanford Online Products), CAR196, CUB200-2011 데이터셋과 얼굴 검증을 위한 LFW 데이터셋에서 우리의 접근 방식을 평가했습니다. 우리의 방법은 모든 데이터셋에서 최신 수준의 성능을 달성하였습니다.