2 个月前

MCBLT:长视频中的多相机多目标3D跟踪

Wang, Yizhou ; Meinhardt, Tim ; Cetintas, Orcun ; Yang, Cheng-Yen ; Pusegaonkar, Sameer Satish ; Missaoui, Benjamin ; Biswas, Sujit ; Tang, Zheng ; Leal-Taixé, Laura
MCBLT:长视频中的多相机多目标3D跟踪
摘要

多视角相机的对象感知对于智能系统至关重要,尤其是在室内环境,如仓库、零售商店和医院中。大多数传统的多目标多相机(MTMC)检测和跟踪方法依赖于二维对象检测、单视角多对象跟踪(MOT)以及跨视角重识别(ReID)技术,而未能充分处理通过多视角图像聚合获得的重要三维信息。本文提出了一种名为MCBLT的三维对象检测和跟踪框架,该框架首先利用必要的相机校准参数对多视角图像进行聚合,以在鸟瞰图(BEV)中获取三维对象检测结果。随后,我们引入了分层图神经网络(GNNs),在BEV中跟踪这些三维检测结果,从而实现MTMC跟踪效果。与现有方法不同,MCBLT在不同场景和多样化的相机设置下表现出色的泛化能力,并且具有卓越的长期关联处理能力。因此,我们提出的MCBLT在AICity'24数据集上取得了81.22的HOTA分数,在WildTrack数据集上取得了95.6的IDF1分数,建立了新的最先进水平。

MCBLT:长视频中的多相机多目标3D跟踪 | 最新论文 | HyperAI超神经