보정된 이웃 인식(confidence) 측도를 이용한 딥 메트릭 학습

최근 딥 러닝의 성공에 힘입어 딥 메트릭 학습(deep metric learning)은 놀라운 발전을 보여왔다. 이 기술은 소수 샘플 학습(few-shot learning), 이미지 검색(image retrieval), 오픈셋 분류(open-set classification) 등 다양한 문제에 성공적으로 적용되어 왔다. 그러나 딥 메트릭 학습 모델의 신뢰도(confidence)를 측정하고 신뢰할 수 없는 예측을 식별하는 것은 여전히 해결되지 않은 과제이다. 본 논문은 분류 정확도와 밀접하게 부합하는 보정(calibrated)되고 해석 가능한 신뢰도 지표를 정의하는 데 초점을 맞춘다. 학습된 거리 메트릭을 기반으로 잠재 공간(latent space)에서 직접 유사도 비교를 수행하는 동시에, 각 클래스에 대한 데이터 포인트 분포를 가우시안 커널 스무딩 함수(Gaussian kernel smoothing function)를 사용하여 근사화한다. 제안된 신뢰도 지표를 활용한 후처리 보정 알고리즘은 보유한 검증 데이터셋에서 모델의 일반화 능력과 강건성을 향상시키며, 동시에 신뢰도에 대한 해석 가능한 추정을 제공한다. 캘텍-UCSD 버드(Caltech-UCSD Birds), 스탠포드 온라인 제품(Stanford Online Product), 스탠포드 카-196(Stanford Car-196), 인숍 의류 검색(In-shop Clothes Retrieval) 등 네 가지 대표적인 벤치마크 데이터셋에서 실시한 광범위한 실험 결과는, 추가 노이즈나 적대적 예제(adversarial examples) 등으로 인한 테스트 데이터의 분포 변화가 존재하는 상황에서도 일관된 성능 향상이 이루어짐을 보여준다.