4달 전

반감독형 영역 일반화 가능한 사람 재식별

He, Lingxiao ; Liu, Wu ; Liang, Jian ; Zheng, Kecheng ; Liao, Xingyu ; Cheng, Peng ; Mei, Tao
반감독형 영역 일반화 가능한 사람 재식별
초록

기존의 사람 재식별(re-id) 방법들은 교차 카메라 사람 매칭에서 성공을 거두었음에도 불구하고, 새로운 미경험 시나리오에 배포될 때 어려움을 겪습니다. 최근에는 새로운 시나리오에서 확장된 라벨링되지 않은 데이터를 전이 학습(transductive learning) 방식으로 활용하는 도메인 적응형 사람 재식별에 많은 노력을 기울이고 있습니다. 그러나 각 시나리오마다 충분한 데이터를 먼저 수집하고, 그런 다음 도메인 적응형 re-id 모델을 훈련시켜야 하므로, 이들의 실용적 적용이 제한됩니다. 대신 우리는 여러 개의 라벨링된 데이터셋을 활용하여 사람 재식별에 일반화된 도메인 불변 표현을 학습하는 것을 목표로 합니다. 이는 각각의 새로운 재식별 시나리오에 대해 보편적으로 효과적이어야 함을 의미합니다.실제 시스템에서의 실용성을 추구하기 위해, 우리는 이 분야의 모든 사람 재식별 데이터셋(20개 데이터셋)을 수집하고, 가장 자주 사용되는 세 가지 데이터셋(즉, Market1501, DukeMTMC, MSMT17)을 미경험 타겟 도메인으로 선정하였습니다. 또한, YouTube 거리 경치 동영상에서 약 30만 장 이상의 약간 주석이 달린 이미지를 수집하는 DataHunter를 개발하였으며, 이를 17개의 나머지 완전히 라벨링된 데이터셋과 결합하여 다중 소스 도메인을 형성하였습니다.약 44만 장 이상의 라벨링된 이미지를 포함하는 큰 규모와 어려운 벤치마크 FastHuman에서, 우리는 간단하면서도 효과적인 반감독 지식 증류(Semi-Supervised Knowledge Distillation, SSKD) 프레임워크를 제안하였습니다. SSKD는 YouTube-Human에 부드러운 의사 라벨(soft pseudo labels)을 할당하여 약간 주석이 달린 데이터를 효과적으로 활용함으로써 모델의 일반화 능력을 향상시킵니다. 여러 프로토콜에서 수행된 실험은 제안된 SSKD 프레임워크가 도메인 일반화 가능한 사람 재식별에서 효과적임을 검증하였으며, 이는 심지어 타겟 도메인에서 감독 학습(supervised learning)과 비교할 만큼 우수한 성능을 보입니다.마지막으로, 가장 중요한 점은 우리가 제안한 벤치마크 FastHuman이 도메인 일반화 가능한 사람 재식별 알고리즘의 다음 발전 단계를 가져올 수 있기를 바랍니다.