2 个月前

面向实时的多目标跟踪

Zhongdao Wang; Liang Zheng; Yixuan Liu; Yali Li; Shengjin Wang
面向实时的多目标跟踪
摘要

现代多目标跟踪(MOT)系统通常遵循\emph{检测跟踪}范式。该范式包括1)用于目标定位的检测模型和2)用于数据关联的外观嵌入模型。分别执行这两个模型可能会导致效率问题,因为运行时间仅仅是两个步骤的简单相加,而没有探索它们之间可以共享的潜在结构。现有的实时MOT研究通常集中在关联步骤上,因此本质上是实时关联方法,而不是完整的实时MOT系统。在本文中,我们提出了一种允许目标检测和外观嵌入在一个共享模型中学习的MOT系统。具体而言,我们将外观嵌入模型整合到单次检测器中,使得该模型能够同时输出检测结果和相应的嵌入向量。我们进一步提出了一种简单且快速的关联方法,与联合模型协同工作。在这两个组件中,计算成本相比以往的MOT系统显著降低,从而为未来的实时MOT算法设计提供了一个简洁且快速的基础方案。据我们所知,这是首次报告(接近)实时MOT系统的成果,其运行速度根据输入分辨率的不同可达到22至40帧每秒(FPS)。与此同时,其跟踪精度与采用独立检测和嵌入(SDE)学习的最先进跟踪器相当(在MOT-16挑战赛上的MOTA分别为64.4%和66.1%)。代码和模型可在\url{https://github.com/Zhongdao/Towards-Realtime-MOT}获取。注:\emph{tracking-by-detection} 被翻译为“检测跟踪”范式;SDE 是 Separate Detection and Embedding 的缩写,在文中保留了英文缩写以保持专业性。

面向实时的多目标跟踪 | 最新论文 | HyperAI超神经