14일 전

자연환경에서 비감독 동영상 인물 재식별을 위한 강건한 앵커 임베딩

{Xiangyuan Lan, Pong C. Yuen, Mang Ye}
자연환경에서 비감독 동영상 인물 재식별을 위한 강건한 앵커 임베딩
초록

이 논문은 비감독형 영상 기반 인물 재식별(Re-ID)에서 불균형한 레이블 없음 데이터로부터 레이블을 추정하는 과정에서 발생하는 확장성 및 견고성 문제를 다룬다. 이를 해결하기 위해, 대규모 비감독 영상 Re-ID를 위한 깊은 특징 표현 학습을 기반으로 한 새로운 견고한 앵커 임베딩(Robust AnChor Embedding, RACE) 프레임워크를 제안한다. 본 프레임워크 내에서, 서로 다른 개인을 대표하는 앵커 시퀀스를 먼저 선정하여 앵커 그래프를 구성하고, 이는 이후 레이블 추정을 위한 구분 가능한 특징 표현을 얻기 위해 CNN 모델의 초기화에도 활용된다. 노이즈가 포함된 프레임을 가진 레이블 없음 시퀀스로부터 정확한 레이블을 추정하기 위해, 정규화된 아핀 껍질(affine hull) 기반의 견고한 앵커 임베딩 기법을 도입한다. 다양체 가정 하에서 전체 앵커 집합 대신 kNN 앵커 임베딩을 활용함으로써 효율성도 보장된다. 이후, 레이블 없음 이미지 시퀀스의 레이블을 예측하기 위한 견고하고 효율적인 top-k 카운트 레이블 예측 전략을 제안한다. 새로 추정된 레이블 시퀀스를 활용하여, 통합된 앵커 임베딩 프레임워크는 특징 학습 과정을 더욱 촉진할 수 있다. 대규모 데이터셋을 대상으로 수행된 광범위한 실험 결과는 제안된 방법이 기존 비감독 영상 Re-ID 기법들보다 우수함을 입증한다.