17일 전

이미지 검색에서 중심점의 비합리적인 효과성

Mikolaj Wieczorek, Barbara Rychalska, Jacek Dabrowski
이미지 검색에서 중심점의 비합리적인 효과성
초록

이미지 검색 작업은 쿼리 이미지와 유사한 이미지를 갤러리(데이터베이스) 이미지 집합에서 찾는 것으로 구성된다. 이러한 시스템은 사람 재식별(Person Re-Identification, ReID)이나 시각적 제품 검색과 같은 다양한 응용 분야에서 활용된다. 검색 모델의 지속적인 발전에도 불구하고, 시점 각도, 조명 조건, 배경의 복잡성 또는 가림 현상 등으로 인한 클래스 내 변동성(intra-class variance)이 크기 때문에 여전히 도전적인 과제로 남아 있다. 반면 클래스 간 변동성(inter-class variance)은 비교적 낮을 수 있다. 현재 많은 연구는 더 강건한 특징을 생성하고, 일반적으로 트립렛 손실(Triplet Loss) 기반의 목적 함수를 수정하는 데 집중하고 있다. 일부 연구에서는 트립렛 손실과 함께 사용되는 계산 속도 문제 및 하드 샘플 마이닝(hard samples mining) 문제를 완화하기 위해 클래스의 중심점(Centroid) 또는 프록시(Proxy) 표현을 사용해보는 실험을 수행하고 있다. 그러나 이러한 접근 방식은 학습 단계에서만 사용되며, 검색 단계에서는 폐기된다. 본 논문에서는 학습 단계와 검색 단계 모두에서 평균 중심점(centroid) 표현을 사용하는 방법을 제안한다. 이러한 집계된 표현은 이상치(outliers)에 대해 더 강건하며, 보다 안정적인 특징을 보장한다. 각 클래스가 단일 임베딩인 클래스 중심점으로 표현되므로, 검색 시간과 저장 공간 요구량이 크게 감소한다. 여러 임베딩을 집계함으로써 후보 타겟 벡터의 수가 감소하여 검색 공간이 크게 축소되며, 이는 제조 환경(production deployment)에 특히 적합한 방법이다. 두 개의 ReID 및 패션 검색(Fashion Retrieval) 데이터셋에서 수행한 포괄적인 실험을 통해 제안한 방법의 효과성을 입증하였으며, 기존 최고 성능(SOTA)을 초월함을 확인하였다. 본 연구는 중심점 기반의 학습과 검색을 패션 검색 및 ReID 응용 분야에서 실용적인 대안으로 제안한다.