
摘要
多目标跟踪(Multi-object tracking, MOT)是计算机视觉领域的一个重要问题,具有广泛的应用前景。将MOT建模为单一网络中目标检测与重识别(re-ID)的多任务学习,具有显著吸引力,因为它能够实现两个任务的联合优化,并具备较高的计算效率。然而,我们发现这两个任务之间存在明显的竞争关系,需加以妥善处理。特别是,以往方法通常将re-ID视为次要任务,其性能严重依赖于主要的检测任务,导致网络倾向于优化检测任务,从而对re-ID任务产生不公平的偏差。为解决该问题,本文提出一种简单而有效的框架——FairMOT,其基于无锚点(anchor-free)的目标检测架构CenterNet。需要强调的是,FairMOT并非简单地将CenterNet与re-ID进行拼接,而是通过一系列经过充分实证研究验证的关键设计,显著提升了跟踪性能。所提出的方法在检测与跟踪任务上均实现了高精度,且在多个公开数据集上显著超越了当前最先进方法。相关源代码与预训练模型已开源,地址为:https://github.com/ifzhang/FairMOT。