
사람 재식별(Person re-identification, re-ID)은 서로 다른 카메라에서 촬영된 동일한 사람의 이미지를 식별하는 것을 목표로 한다. 그러나 서로 다른 데이터셋 간의 도메인 차이로 인해, 하나의 데이터셋에서 학습된 re-ID 모델을 다른 데이터셋에 적용하는 데 있어 큰 도전이 존재한다. 최신의 비지도 도메인 적응(unsupervised domain adaptation) 기법들은 타겟 도메인에서 클러스터링 알고리즘을 활용해 생성한 가짜 레이블(pseudo labels)을 최적화함으로써 소스 도메인에서 학습한 지식을 타겟 도메인으로 전이하는 방식을 사용해 최고의 성능을 달성하였다. 그러나 클러스터링 과정에서 불가피하게 발생하는 레이블 노이즈는 이러한 기법들에서 간과되고 있다. 이러한 노이즈가 포함된 가짜 레이블은 타겟 도메인에서 특징 표현을 더욱 향상시키는 데 큰 제약이 된다.이러한 문제를 완화하기 위해, 우리는 오프라인으로 정제된 하드 가짜 레이블과 온라인으로 정제된 소프트 가짜 레이블을 교대 학습 방식으로 활용하여 타겟 도메인에서 보다 우수한 특징을 학습할 수 있도록 하는 비지도 프레임워크인 상호 평균-학습(Mutual Mean-Teaching, MMT)을 제안한다. 또한, 기존의 사람 재식별 모델에서 최적의 성능을 달성하기 위해 분류 손실(classification loss)과 트립렛 손실(triplet loss)을 함께 사용하는 것이 일반적인 관행이다. 그러나 기존의 트립렛 손실은 소프트하게 정제된 레이블과 함께 작동할 수 없다. 이를 해결하기 위해, 소프트 가짜 트립렛 레이블을 활용한 학습을 지원할 수 있는 새로운 소프트 소프트맥스-트립렛 손실(soft softmax-triplet loss)을 제안하였다.제안된 MMT 프레임워크는 Market-to-Duke, Duke-to-Market, Market-to-MSMT, Duke-to-MSMT 비지도 도메인 적응 작업에서 각각 14.4%, 18.2%, 13.1%, 16.4%의 mAP 향상률을 기록하며 상당한 성능 향상을 보였다. 코드는 https://github.com/yxgeee/MMT 에서 공개되어 있다.