11 天前
人群中的无人机检测、跟踪与计数:一个基准评测
Longyin Wen, Dawei Du, Pengfei Zhu, Qinghua Hu, Qilong Wang, Liefeng Bo, Siwei Lyu

摘要
为推动无人机拍摄视频中目标检测、跟踪与计数算法的发展,我们构建了一个新的基准测试平台,其核心是一个名为 DroneCrowd 的大规模无人机视频数据集。该数据集由112段视频片段组成,包含33,600帧高清视频画面,覆盖多种复杂场景。值得注意的是,我们对其中20,800条人员轨迹进行了标注,共包含480万个人头实例,并标注了多个视频级别的属性信息。与此同时,我们提出了一种名为时空邻域感知网络(Space-Time Neighbor-Aware Network, STNNet)的强基准模型,用于在密集人群场景下联合完成目标检测、跟踪与计数任务。STNNet由特征提取模块、密度图估计分支,以及定位与关联子网络构成。为充分挖掘邻近目标之间的上下文信息,我们设计了邻域上下文损失(neighboring context loss),用于指导关联子网络的训练,该损失函数强制在时间维度上保持相邻目标之间的相对位置一致性。在 DroneCrowd 数据集上的大量实验表明,STNNet 在各项任务上均显著优于当前最先进的方法,展现出优异的性能与鲁棒性。