
초록
딥러닝 방법이 비디오 기반 사람 재식별(re-id) 연구의 진전을 주도하기 시작했습니다. 그러나 기존 방법들은 대부분 감독 학습을 고려하여, 시점 간 쌍 데이터를 라벨링하는 데 많은 수작업이 필요합니다. 따라서 이러한 방법들은 실제 비디오 감시 응용 분야에서 확장성과 실용성이 크게 부족합니다. 본 연구에서는 비디오 사람 재식별 작업을 해결하기 위해 새로운 딥 연관 학습(Deep Association Learning, DAL) 방안을 제시합니다. 이는 모델 초기화와 훈련 과정에서 신원 라벨을 전혀 사용하지 않는 최초의 엔드투엔드 딥러닝 방법입니다. DAL은 각 프레임의 가장 잘 매칭된 동일 카메라 표현과 다른 카메라 표현 간의 연관성을 효과적으로 제약하는 두 가지 마진 기반 연관 손실을 엔드투엔드 방식으로 공동 최적화하여 깊은 재식별 매칭 모델을 학습합니다. 기존 표준 CNNs는 우리의 DAL 방안 내에서 쉽게 활용될 수 있습니다. 실험 결과, 제안된 DAL이 PRID 2011, iLIDS-VID 및 MARS 세 벤치마크에서 현재 최고 수준의 비감독 비디오 사람 재식별 방법들보다 크게 우수함을 입증하였습니다.