
초록
전통적으로 추적은 공간과 시간을 따라 관심 점을 따라가는 예술이었다. 그러나 강력한 딥 네트워크의 등장과 함께 이 상황은 변화했다. 현재 추적 기술은 객체 탐지 후 시간적 연결을 수행하는 파이프라인, 즉 '탐지 기반 추적(tracking-by-detection)' 방식으로 주도되고 있다. 본 논문에서는 기존 최고 수준의 기술보다 간단하고 빠르며 정확도가 높은 동시 탐지 및 추적 알고리즘을 제안한다. 본 연구에서 제안하는 추적기인 CenterTrack은 이전 프레임의 이미지와 탐지 결과를 입력으로 받아, 탐지 모델을 적용하여 객체의 위치를 정확히 파악하고, 이전 프레임과의 연결 관계를 예측한다. 이는 전부이다. CenterTrack은 간단하며, 온라인 방식(미래를 미리 보지 않음)이며 실시간으로 작동한다. MOT17 챌린지에서 22 FPS 속도로 67.3%의 MOTA를 달성하고, KITTI 추적 벤치마크에서는 15 FPS에서 89.4%의 MOTA를 기록하여 두 데이터셋 모두에서 새로운 최고 성능을 세웠다. 또한 CenterTrack은 추가적인 3D 속성 회귀를 통해 단안 3D 추적으로 쉽게 확장 가능하다. 단안 영상 입력만을 사용하여 최신에 공개된 nuScenes 3D 추적 벤치마크에서 [email protected] 기준 28.3%의 성능을 달성하며, 해당 벤치마크의 단안 기준 모델을 크게 상회하면서도 28 FPS로 실행 가능하다.