11일 전
TransMOT: 다중 객체 추적을 위한 공간-시간 그래프 트랜스포머
Peng Chu, Jiang Wang, Quanzeng You, Haibin Ling, Zicheng Liu

초록
비디오에서 다중 객체를 추적하는 작업은 객체 간 공간-시적 상호작용을 모델링하는 데 의존한다. 본 논문에서는 공간적 및 시간적 상호작용을 효율적으로 모델링하기 위해 강력한 그래프 트랜스포머(Graph Transformer)를 활용하는 솔루션인 TransMOT을 제안한다. TransMOT은 추적된 객체들의 경로를 희소 가중 그래프의 집합으로 정렬함으로써 대규모 객체 간의 상호작용을 효과적으로 모델링한다. 이를 바탕으로 공간 그래프 트랜스포머 인코더 레이어, 시간 트랜스포머 인코더 레이어, 그리고 공간 그래프 트랜스포머 디코더 레이어를 구성한다. TransMOT은 기존 트랜스포머보다 더 높은 계산 효율성을 가지며, 동시에 더 뛰어난 추적 정확도를 달성한다. 추적 속도와 정확도를 추가로 향상시키기 위해, TransMOT에서 계산 자원이 많이 필요한 저점수 탐지 및 장기적 가림 현상을 처리하기 위한 계단식 연관( cascade association) 프레임워크를 제안한다. 제안한 방법은 MOT15, MOT16, MOT17, MOT20 등 여러 벤치마크 데이터셋에서 평가되었으며, 모든 데이터셋에서 최신 기술 수준(SOTA, State-of-the-art)의 성능을 달성하였다.