비감독형 사람 재식별을 위한 샘플링 전략의 재고

비지도(person re-identification, re-ID)는 여전히 도전적인 과제로 남아 있다. 기존의 많은 연구는 프레임워크 설계 및 손실 함수에 집중해 왔으나, 본 논문은 샘플링 전략이 동일한 프레임워크와 손실 함수 하에서도 동일한 중요성을 지닌다는 점을 입증한다. 우리는 동일한 프레임워크와 손실 함수 하에서 다양한 샘플링 전략 간 성능 차이의 원인을 분석하며, 과적합(over-fitting) 악화가 성능 저하의 중요한 원인임을 제안한다. 이 문제를 해결하기 위해 통계적 안정성(statistical stability)을 강화하는 것이 효과적임을 보여준다. 이를 바탕으로, 동일한 클래스에서 샘플을 그룹으로 묶는 그룹 샘플링(Group Sampling)이라는 간단하면서도 효과적인 방법을 제안한다. 이 방법은 정규화된 그룹 샘플을 사용하여 모델을 훈련함으로써 개별 샘플이 초래하는 부정적 영향을 완화한다. 그룹 샘플링은 의사 레이블( pseudo-label) 생성 파이프라인을 개선하여 샘플이 보다 효율적으로 올바른 클래스로 분류되도록 보장한다. 또한 표현 학습 과정을 조절하여 특징 표현의 통계적 안정성을 점진적으로 향상시킨다. Market-1501, DukeMTMC-reID, MSMT17에서 실시한 광범위한 실험 결과, 그룹 샘플링은 최신 기법들과 비교해 유사한 성능을 달성하며, 순수한 카메라 무관(camera-agnostic) 설정 하에서는 기존 기술들을 모두 상회함을 확인하였다. 코드는 https://github.com/ucas-vg/GroupSampling 에 공개되어 있다.