7일 전

GiT: 차량 재식별을 위한 그래프 인터랙티브 트랜스포머

Fei Shen, Yi Xie, Jianqing Zhu, Xiaobin Zhu, Huanqiang Zeng
GiT: 차량 재식별을 위한 그래프 인터랙티브 트랜스포머
초록

Transformer는 컴퓨터 비전 분야에서 점점 더 인기를 끌고 있으며, 이미지를 패치들의 시퀀스로 간주하고 이 시퀀스를 통해 강력한 전역 특징을 학습한다. 그러나 순수한 Transformer는 차량 재식별(vehicle re-identification)에는 완전히 적합하지 않다. 왜냐하면 차량 재식별은 강력한 전역 특징뿐만 아니라 구분력 있는 국소 특징도 필요하기 때문이다. 이를 해결하기 위해 본 논문에서는 그래프 상호작용 Transformer(GiT)를 제안한다. 거시적 관점에서 GiT 블록들이 쌓여 차량 재식별 모델이 구성되며, 여기서 그래프는 패치 내부에서 구분력 있는 국소 특징을 추출하고, Transformer는 패치 간의 강력한 전역 특징을 추출한다. 미시적 관점에서 그래프와 Transformer는 상호작용 상태에 있으며, 국소 특징과 전역 특징 간의 효과적인 협업을 가능하게 한다. 구체적으로, 현재 레벨의 그래프는 이전 레벨의 그래프와 Transformer 뒤에 임베딩되며, 현재 레벨의 Transformer는 현재 그래프와 이전 레벨의 Transformer 뒤에 임베딩된다. 그래프와 Transformer 간의 상호작용 외에도, 본 논문에서 제안하는 그래프는 새로 설계된 국소 보정 그래프(local correction graph)로, 노드 간의 관계를 탐색함으로써 패치 내부에서 구분력 있는 국소 특징을 학습한다. 세 개의 대규모 차량 재식별 데이터셋에서 실시한 광범위한 실험 결과, 제안한 GiT 방법이 최신 기술 대비 우수한 성능을 보임을 입증하였다.