
초록
재식별(ReID) 작업에 대한 연구는 다양한 활용 사례와 제로샷 학습(zero-shot learning) 특성 덕분에 컴퓨터 비전 분야에서 활발히 진행되고 있다. 본 논문에서는 이미지와 영상 ReID를 통합하면서도 학습 파라미터 수를 최소화하는 계산 효율적인 세부 수준의 ReID 모델인 FGReID를 제안한다. FGReID는 영상 기반 사전 학습과 공간적 특징 주의(attention)를 활용하여 영상 및 이미지 ReID 작업 모두에서 성능을 향상시킨다. FGReID는 MARS, iLIDS-VID, PRID-2011 영상 인물 ReID 벤치마크에서 최신 기준(SOTA) 성능을 달성하였으며, 시간 축합(temporal pooling)을 제거함으로써 CUHK01과 Market1501 이미지 인물 ReID 벤치마크에서도 SOTA를 초월하는 이미지 ReID 모델을 구현하였다. 또한, 차량 ReID 데이터셋 VeRi에서도 거의 SOTA 수준의 성능을 기록하며 모델의 일반화 능력을 입증하였다. 추가적으로, ReID 작업에서 모델 성능에 영향을 미치는 핵심 요소들을 분석하기 위한 아블레이션 연구(ablation study)를 수행하였다. 마지막으로, ReID 작업과 관련된 윤리적 딜레마, 특히 기술의 오용 가능성에 대해 논의하였다. 본 연구의 코드는 공개적으로 제공되며, 다음 링크에서 확인할 수 있다: https://github.com/ppriyank/Fine-grained-ReIdentification.