17일 전

카메라 인식 프록시를 활용한 비지도 인물 재식별

Menglin Wang, Baisheng Lai, Jianqiang Huang, Xiaojin Gong, Xian-Sheng Hua
카메라 인식 프록시를 활용한 비지도 인물 재식별
초록

이 논문은 annotation이 전혀 필요하지 않은 순수 비감독(person re-identification, Re-ID) 문제에 대해 다룬다. 이전의 일부 방법들은 클러스터링 기법을 활용하여 의사 레이블(pseudo labels)을 생성하고, 생성된 레이블을 이용해 Re-ID 모델을 점진적으로 학습시키는 방식을 채택한다. 이러한 방법들은 상대적으로 간단하면서도 효과적이다. 그러나 대부분의 클러스터링 기반 방법은 각 클러스터를 하나의 의사 정체성 클래스로 간주하며, 주로 카메라 시점의 변화로 인해 발생하는 큰 내부 정체성(variance)를 간과한다. 이러한 문제를 해결하기 위해, 본 논문에서는 단일 클러스터를 여러 개의 프록시(proxy)로 분할하는 방식을 제안한다. 각 프록시는 동일한 카메라에서 발생한 인스턴스를 대표하게 되며, 카메라 인식형 프록시는 큰 내부 정체성 변동성을 효과적으로 다룰 수 있도록 하여, 학습을 위한 더 신뢰할 수 있는 의사 레이블을 생성할 수 있다. 이러한 카메라 인식형 프록시를 기반으로, 카메라 내 및 카메라 간에서의 정체성 구분 능력을 효과적으로 학습할 수 있도록, 내부 및 외부 카메라 대비 학습(intra- and inter-camera contrastive learning) 구성 요소를 설계하였다. 동시에, 프록시 균형 샘플링 전략(proxy-balanced sampling strategy)도 도입하여 학습 과정을 더욱 촉진한다. 대규모 Re-ID 데이터셋 세 개에 대한 광범위한 실험 결과, 제안하는 방법이 대부분의 비감독 방법보다 뚜렷한 성능 우위를 보였다. 특히 도전적인 MSMT17 데이터셋에서는 2위 성능 대비 Rank-1 점수에서 14.3%, mAP에서 10.2%의 개선을 달성하였다. 코드는 다음과 같은 링크에서 공개되어 있다: \texttt{https://github.com/Terminator8758/CAP-master}.

카메라 인식 프록시를 활용한 비지도 인물 재식별 | 최신 연구 논문 | HyperAI초신경