2달 전

지역 유사성 인식 깊은 특징 임베딩

Chen Huang; Chen Change Loy; Xiaoou Tang
지역 유사성 인식 깊은 특징 임베딩
초록

기존의 시각적 작업에서의 딥 임베딩 방법은 이미지로부터 유사성 지표에 해당하는 유클리드 거리를 학습할 수 있는 컴팩트한 유클리드 공간을 생성할 수 있습니다. 학습을 더욱 효과적이고 효율적으로 만들기 위해 일반적으로 하드 샘플 마이닝(hard sample mining)이 사용되며, 이는 유클리드 특징 거리를 계산하여 샘플을 식별합니다. 그러나 전역적인 유클리드 거리는 복잡한 시각적 특징 공간에서 진정한 특징 유사성을 충실하게 표현하지 못하며, 고밀도 영역에서의 클래스 내 거리는 저밀도 영역에서의 클래스 간 거리보다 클 수 있습니다. 본 논문에서는 로컬 특징 구조에 적응할 수 있는 유사성 지표를 학습하는 위치 종속 딥 메트릭(Position-Dependent Deep Metric, PDDM) 유닛을 소개합니다. 이 메트릭은 온라인으로 그리고 강건하게 딥 임베딩 학습을 안내하기 위해 로컬 이웃에서 실제로 어려운 샘플을 선택하는 데 사용될 수 있습니다. 새로운 층은 어떤 컨볼루션 네트워크에도 연결 가능하며, 엔드 투 엔드로 훈련됩니다. 우리의 로컬 유사성 인식 특징 임베딩은 두 개의 복잡한 이미지 검색 데이터셋에서 더 빠른 수렴과 성능 향상을 보여주며, 큰 마진 특성으로 인해 ImageNet 2010 및 ImageNet-10K 데이터셋에서 전이 학습과 제로샷 학습의 대규모 오픈 세트 시나리오에서도 우수한 일반화 결과를 제공합니다.