17일 전

비지도 사전 학습을 통한 개인 재식별

Dengpan Fu, Dongdong Chen, Jianmin Bao, Hao Yang, Lu Yuan, Lei Zhang, Houqiang Li, Dong Chen
비지도 사전 학습을 통한 개인 재식별
초록

이 논문에서는 레이블이 없는 대규모 개인 재식별(Person Re-ID) 데이터셋인 ‘LUPerson’을 제안하고, 학습된 개인 Re-ID 특징 표현의 일반화 능력을 향상시키기 위해 비지도 사전 훈련(unsupervised pre-training)을 처음으로 시도한다. 이는 기존 모든 개인 Re-ID 데이터셋이 데이터 레이블링에 소요되는 비용이 크기 때문에 규모가 제한되어 있다는 문제를 해결하기 위한 것이다. 기존 연구들은 ImageNet에서 사전 훈련된 모델을 활용하여 Re-ID 데이터 부족 문제를 완화하려 했지만, ImageNet과 개인 Re-ID 데이터 사이에 큰 도메인 갭(domain gap)이 존재하는 한계를 지닌다. LUPerson은 20만 명 이상의 개체(identity)에 대한 400만 장의 이미지를 포함한 레이블이 없는 데이터셋으로, 기존 최대 규모 Re-ID 데이터셋보다 30배 이상 크며, 카메라 설정, 장면 등 다양한 촬영 환경을 포괄하고 있다. 이 데이터셋을 기반으로, 데이터 증강(data augmentation)과 대조 손실(contrastive loss)의 두 가지 관점에서 Re-ID 특징 학습의 핵심 요인을 체계적으로 탐구하였다. 대규모 데이터셋에서 수행된 비지도 사전 훈련은 모든 기존 개인 Re-ID 방법에 유익한 일반화된 Re-ID 특징을 효과적으로 생성한다. 기본 프레임워크에 본 연구에서 사전 훈련한 모델을 적용함으로써, CUHK03, Market1501, DukeMTMC, MSMT17 등 널리 사용되는 네 가지 Re-ID 데이터셋에서 별도의 특수 기법 없이도 최신 기술 수준(SOTA)의 성능을 달성하였다. 또한, 작은 규모의 타겟 데이터셋이나 소수 샘플(few-shot) 설정에서 성능 향상이 더욱 두드러진다는 점도 확인되었다.

비지도 사전 학습을 통한 개인 재식별 | 최신 연구 논문 | HyperAI초신경