2달 전

실시간 다중 객체 추적을 향하여

Zhongdao Wang; Liang Zheng; Yixuan Liu; Yali Li; Shengjin Wang
실시간 다중 객체 추적을 향하여
초록

현대 다중 객체 추적(MOT) 시스템은 일반적으로 \emph{검출을 통한 추적(tracking-by-detection)} 패러다임을 따릅니다. 이 패러다임은 1) 대상 위치 결정을 위한 검출 모델과 2) 데이터 연관성을 위한 외관 임베딩 모델을 포함합니다. 두 모델을 별도로 실행하는 것은 효율성 문제를 초래할 수 있으며, 이는 두 단계 사이에서 공유될 수 있는 잠재적인 구조를 조사하지 않기 때문에 발생합니다. 실시간 MOT에 대한 기존 연구는 주로 연관성 단계에 초점을 맞추고 있으므로, 본질적으로 실시간 연관성 방법이지만 전체적인 실시간 MOT 시스템은 아닙니다. 본 논문에서는 대상 검출과 외관 임베딩이 공유된 모델에서 학습될 수 있도록 하는 MOT 시스템을 제안합니다. 구체적으로, 외관 임베딩 모델을 싱글샷 검출기에 통합하여, 모델이 동시에 검출 결과와 해당 임베딩을 출력할 수 있도록 하였습니다. 또한, 이 결합된 모델과 함께 작동하는 간단하고 빠른 연관성 방법을 제안하였습니다. 두 구성 요소 모두 계산 비용이 기존의 MOT 시스템보다 크게 줄어들어, 향후 실시간 MOT 알고리즘 설계를 위한 깔끔하고 빠른 베이스라인을 제공합니다. 우리所知, 이 연구는 (거의) 실시간 MOT 시스템의 첫 보고이며, 입력 해상도에 따라 22~40 FPS의 실행 속도를 나타냅니다. 동시에, 이 시스템의 추적 정확도는 별도의 검출 및 임베딩(SDE) 학습 방식으로 이루어진 최신 트래커들과 비교해도 유사한 수준입니다( MOT-16 챌린지에서 MOTA $64.4\%$ vs $66.1\%$). 코드와 모델은 \url{https://github.com/Zhongdao/Towards-Realtime-MOT}에서 확인할 수 있습니다.注:在“우리所知”中,“所知”是中文,正确的韩文应该是“우리가 알고 있는 한”。以下是修正后的版本:현대 다중 객체 추적(MOT) 시스템은 일반적으로 \emph{검출을 통한 추적(tracking-by-detection)} 패러다임을 따릅니다. 이 패러다임은 1) 대상 위치 결정을 위한 검출 모델과 2) 데이터 연관성을 위한 외관 임베딩 모델을 포함합니다. 두 모델을 별도로 실행하는 것은 효율성 문제를 초래할 수 있으며, 이는 두 단계 사이에서 공유될 수 있는 잠재적인 구조를 조사하지 않기 때문에 발생합니다. 실시간 MOT에 대한 기존 연구는 주로 연관성 단계에 초점을 맞추고 있으므로, 본질적으로 실시간 연관성 방법이지만 전체적인 실시간 MOT 시스템은 아닙니다. 본 논문에서는 대상 검출과 외관 임베딩이 공유된 모델에서 학습될 수 있도록 하는 MOT 시스템을 제안합니다. 구체적으로, 외관 임베딩 모델을 싱글샷 검출기에 통합하여, 모델이 동시에 검출 결과와 해당 임베딩을 출력할 수 있도록 하였습니다. 또한, 이 결합된 모델과 함께 작동하는 간단하고 빠른 연관성 방법을 제안하였습니다. 두 구성 요소 모두 계산 비용이 기존의 MOT 시스템보다 크게 줄어들어, 향후 실시간 MOT 알고리즘 설계를 위한 깔끔하고 빠른 베이스라인을 제공합니다. 우리가 알고 있는 한, 이 연구는 (거의) 실시간 MOT 시스템의 첫 보고이며, 입력 해상도에 따라 22~40 FPS의 실행 속도를 나타냅니다. 동시에, 이 시스템의 추적 정확도는 별도의 검출 및 임베딩(SDE) 학습 방식으로 이루어진 최신 트래커들과 비교해도 유사한 수준입니다( MOT-16 챌린지에서 MOTA $64.4\%$ vs $66.1\%$). 코드와 모델은 \url{https://github.com/Zhongdao/Towards-Realtime-MOT}에서 확인할 수 있습니다.

실시간 다중 객체 추적을 향하여 | 최신 연구 논문 | HyperAI초신경