
摘要
提出了一种新的在线多目标跟踪(MOT)算法——IMM联合单应矩阵状态估计(IMM-JHSE)。IMM-JHSE仅使用初始单应矩阵估计作为额外的3D信息,而其他3D MOT方法则依赖常规的3D测量数据。通过将单应矩阵及其动态特性作为轨迹状态向量的一部分进行联合建模,IMM-JHSE消除了先前方法中显式的相机运动补偿技术对预测轨迹位置状态的影响。在此基础上,静态和动态相机运动模型通过交互式多模型(IMM)滤波器结合在一起。为了融合图像平面信息,该算法采用了一个简单的边界框运动模型来预测边界框的位置。此外,除了将IMM应用于相机运动外,还采用了一种非标准的IMM方法,即将基于边界框的BIoU分数与基于地面平面的马氏距离以类似IMM的方式混合,仅用于关联操作,从而使IMM-JHSE在远离地面平面的运动中具有鲁棒性。最后,IMM-JHSE利用了动态过程和测量噪声估计技术。在DanceTrack和KITTI汽车数据集上,IMM-JHSE相比相关技术(如UCMC-Track、OC-SORT、C-BIoU和ByteTrack)分别提高了2.64和2.11的HOTA指标,同时在MOT17、MOT20和KITTI行人数据集上表现出竞争力。使用公开可用的检测结果,IMM-JHSE在KITTI汽车数据集上几乎超越了所有其他2D MOT方法,仅被一些离线3D MOT方法超越。与注意力跟踪方法相比,IMM-JHSE在DanceTrack数据集上的表现非常相似,并且在MOT17数据集上优于这些方法。代码已公开发布:https://github.com/Paulkie99/imm-jhse。