11일 전

강건한 비지도 영상 인물 재식별 활용

Xianghao Zang, Ge Li, Wei Gao, Xiujun Shu
강건한 비지도 영상 인물 재식별 활용
초록

비지도 영상 인물 재식별(ReID) 방법은 일반적으로 전역 수준의 특징에 의존한다. 반면, 많은 지도 학습 기반 ReID 방법은 국소 수준의 특징을 활용하여 상당한 성능 향상을 달성하였다. 그러나 비지도 학습 방법에 국소 수준의 특징을 적용할 경우 성능의 불안정성이 발생할 수 있다. 비지도 영상 ReID의 성능 안정성을 향상시키기 위해 본 논문은 부분 모델과 비지도 학습을 융합하는 일반적인 프레임워크를 제안한다. 이 프레임워크에서는 전역 수준의 특징을 동일한 국소 수준의 특징으로 분할하고, 국소 수준 특징이 비지도 학습에서 가질 수 있는 잠재력을 탐색하기 위해 국소 인지 모듈을 도입한다. 또한 국소 수준 특징의 단점을 보완하기 위해 전역 인지 모듈을 제안한다. 두 모듈에서 생성된 특징을 융합하여 각 입력 이미지에 대한 강건한 특징 표현을 형성한다. 이 특징 표현은 국소 수준 특징의 장점을 누리면서도 그 단점은 피할 수 있다. 제안된 방법은 PRID2011, iLIDS-VID, DukeMTMC-VideoReID 세 가지 벤치마크에서 종합적인 실험을 수행하였으며, 그 결과 상태의 기술(SOTA) 수준의 성능을 달성함을 입증하였다. 광범위한 아블레이션 연구를 통해 제안된 프레임워크, 국소 인지 모듈, 전역 인지 모듈의 효과성과 강건성을 확인하였다. 코드 및 생성된 특징은 https://github.com/deropty/uPMnet 에 공개되어 있다.