노이즈가 있는 레이블을 활용한 대규모 사전 학습을 통한 사람 재식별

본 논문은 노이즈가 포함된 레이블을 가진 사람 재식별(Person Re-Identification, Re-ID)을 위한 사전 학습 문제를 다루는 것을 목표로 한다. 사전 학습 작업을 설정하기 위해, 기존의 레이블이 없는 Re-ID 데이터셋인 ‘LUPerson’의 원시 영상에 간단한 온라인 다중 객체 추적 시스템을 적용하여, 추적 경로(tracklet)로부터 자동으로 도출된 레이블이 포함된 노이즈 레이블 버전인 ‘LUPerson-NL’을 구축하였다. 이와 같이 추적 경로로부터 자동으로 생성된 ID 레이블은 불가피하게 노이즈를 포함하고 있으므로, 본 연구는 노이즈 레이블을 활용하는 대규모 사전 학습 프레임워크인 PNL(Pre-training with Noisy Labels)을 개발하였다. PNL은 세 가지 학습 모듈로 구성된다: 감독 기반 Re-ID 학습, 프로토타입 기반 대조 학습, 레이블 유도형 대조 학습. 본질적으로 이 세 가지 모듈의 공동 학습은 유사한 예시들을 하나의 프로토타입으로 군집화할 뿐만 아니라, 프로토타입 할당 기반으로 노이즈 레이블을 보정하는 기능도 수행한다. 본 연구에서는 원시 영상에서 직접 학습하는 것이 사전 학습을 위한 유망한 대안임을 입증하며, 공간적 및 시간적 상관관계를 약한 감독 신호로 활용함으로써 효과적인 학습이 가능함을 보였다. 이 간단한 사전 학습 작업은 복잡한 기법 없이도 ‘LUPerson-NL’에서 SOTA(최고 수준의 성능) Re-ID 표현을 처음부터 학습할 수 있는 확장 가능한 방식을 제공한다. 예를 들어, 동일한 감독 기반 Re-ID 방법인 MGN을 적용했을 때, 본 연구에서 제안하는 사전 학습 모델은 CUHK03, DukeMTMC, MSMT17에서 각각 비감독 사전 학습 대비 mAP를 5.7%, 2.2%, 2.3% 향상시켰다. 특히 소규모 또는 소수의 샘플(Small-scale 또는 Few-shot) 설정에서는 성능 향상이 더욱 두드러지며, 학습된 표현의 전이 가능성(transferability)이 뛰어남을 시사한다. 코드는 https://github.com/DengpanFu/LUPerson-NL 에서 제공된다.