18일 전

장기적 개인 재식별을 위한 속성 편향 제거 비전 트랜스포머(AD-ViT)

{and Venu Govindaraju, Srirangaraj Setlur, Deen Mohan, Bhavin Jawade, Kyung Won Lee}
초록

사람 재식별(Person re-identification, re-ID)은 다양한 카메라와 시점에서 촬영된 사람 이미지 갤러리에서 동일한 정체성을 가진 이미지를 검색하는 것을 목표로 한다. 그러나 대부분의 사람 재식별 연구는 외형에 대한 불변성(인variant)을 전제로 하는 단기적 설정을 가정하고 있다. 반면, 장기적 설정에서는 의복이나 액세서리의 변화로 인해 시각적 변동성이 높게 나타나는 경우가 많아, 이로 인해 재식별 작업이 더욱 도전적으로 된다. 따라서 시간에 따라 변하는 특징에 영향을 받지 않고 정체성에 특화된 특징을 학습하는 것은 강건한 장기적 사람 재식별을 위해 필수적이다. 이를 위해 우리는 정체성에 특화된 특징을 직접적으로 학습할 수 있도록 지도를 제공하는 속성 편향 제거 비전 트랜스포머(Attribute De-biased Vision Transformer, AD-ViT)를 제안한다. 구체적으로, 사람 인스턴스에 대해 속성 레이블을 생성하고, 이를 통해 기울기 역전(gradient reversal) 기법을 활용하여 모델이 정체성 특징에 집중하도록 유도한다. 두 개의 장기적 재식별 데이터셋인 LTCC와 NKUP에서 수행한 실험 결과, 제안하는 방법이 현재 최고 수준의 기법들을 일관되게 상회함을 확인하였다.