더 나은 유효성: 감독되지 않은 사람 재식별을 위한 분산 기반 클러스터링

개인 재식별은 비중복 다중 카메라 설치에서 이동하는 사람의 정확한 신원 대응을 설정하는 것을 목표로 합니다. 이 작업에 대한 최근의 딥 러닝 모델 기반 연구는 주로 각 설정에 대해 정확한 주석이 제공된다고 가정되는 지도 학습 시나리오에 초점을 맞추고 있습니다. 개인 재식별을 위한 대규모 데이터셋의 주석화는 요구가 많고 부담스러워, 이러한 지도 접근 방식을 실제 응용 프로그램에 배포하는 것이 현실적으로 어렵습니다. 따라서 명시적인 감독 없이 자율적으로 모델을 훈련시키는 것이 필요합니다. 본 논문에서는 클러스터 유효성 고려를 바탕으로 한 비지도 개인 재식별을 위한 우아하고 실용적인 클러스터링 접근 방식을 제안합니다. 구체적으로, 우리는 통계학에서 기본 개념인 \emph{분산(dispersion)}을 탐구하여 견고한 클러스터링 기준을 달성하였습니다. 분산은 클러스터 내 수준에서 사용될 때 클러스터의 밀집성을 반영하며, 클러스터 간 수준에서 측정될 때 분리를 나타냅니다. 이러한 인사이트를 바탕으로, 우리는 데이터 내의 잠재적 패턴을 발견할 수 있는 새로운 분산 기반 클러스터링(DBC) 접근 방식을 설계하였습니다. 이 접근 방식은 샘플 수준의 쌍별 관계의 더 넓은 맥락을 고려하여 견고한 클러스터 유사성 평가를 수행하며, 일반적으로 발생할 수 있는 불균형 데이터 분포 문제를 처리할 수 있습니다. 또한, 우리의 솔루션은 독립적인 데이터 포인트를 자동으로 우선 순위화하고 열등한 클러스터링을 방지합니다. 이미지 및 비디오 재식별 벤치마크에 대한 우리의 광범위한 실험 분석은 우리 방법이 현존하는 최신 비지도 방법론보다 크게 우수함을 입증하였습니다. 코드는 https://github.com/gddingcs/Dispersion-based-Clustering.git 에서 확인할 수 있습니다.