
摘要
传统上,多目标跟踪与目标检测通常采用独立的系统分别完成,多数先前研究也仅专注于其中某一任务而忽视另一任务。然而,跟踪系统显然能从高精度检测结果中获益,同时文献中已有大量证据表明,检测器同样可以从跟踪信息中受益——例如,跟踪有助于在时间维度上平滑预测结果。本文聚焦于自动驾驶场景下的“检测驱动跟踪”(tracking-by-detection)范式,其中检测与跟踪均属于关键任务。我们提出一种概念简洁且高效的检测与跟踪联合模型,命名为RetinaTrack。该模型在流行的单阶段检测框架RetinaNet的基础上进行改进,使其能够支持实例级嵌入(instance-level embedding)的训练。通过在Waymo开放数据集上的实验评估,我们证明了RetinaTrack在性能上超越了近期最先进的跟踪算法,同时所需计算资源显著减少。我们认为,这一简单而高效的方法可为该领域的后续研究提供一个强有力的基准。