18일 전
템플릿 인지 트랜스포머를 활용한 개인 재식별
{Dongxiao Yu, Xiaowei Yu, Zengrui Zhao, Yanwei Zheng}
초록
사람 재식별(Person reidentification, ReID)은 얼굴 정보가 제공되지 않을 경우 한 명 이상의 사람을 식별하거나 확인하는 데 도전적인 컴퓨터 비전 과제이다. ReID에서 동일한 사람의 이미지 간 구분이 어려운 배경은 일반적으로 모델이 전경을 인식하는 데 영향을 미치며, 이로 인해 ReID 성능이 저하된다. 일반적으로 동일한 카메라의 배경은 유사하지만, 서로 다른 카메라의 배경은 상당히 다를 수 있다. 이러한 관찰을 바탕으로, 트랜스포머 구조에 학습 가능한 템플릿을 도입하여 이미지 내 구분이 어려운 영역(배경 및 가림 영역 포함)에 대한 모델의 주의를 줄이고, 샘플 간 구분이 어려운 특징을 학습할 수 있는 템플릿 인식 트랜스포머(Template-aware Transformer, TAT) 방법을 제안한다. 인코더의 멀티헤드 어텐션 모듈 내에서 이 템플릿은 이미지의 구분이 어려운 특징에 대해 템플릿 기반 어텐션을 유도하며, 인코더 블록이 깊어질수록 구분 가능한 특징에 대한 주의를 점차 증가시킨다. 또한 ReID 과제의 특성을 고려하여 보조 정보를 활용하여 템플릿 수를 늘림으로써, 카메라 ID에 따라 크게 달라지는 배경에 모델이 적응할 수 있도록 한다. 마지막으로, 다양한 공개 데이터셋을 활용하여 제안한 이론의 타당성을 검증하였으며, 정량적 평가를 통해 경쟁력 있는 성능을 달성하였다.