
摘要
近年来,单幅2D图像中的人体检测技术取得了显著进步。然而,相比之下,多摄像机多人跟踪算法在这方面的进展却相对较少,当场景变得非常拥挤时,这些算法的性能仍会严重下降。在本研究中,我们提出了一种新的架构,该架构结合了卷积神经网络(Convolutional Neural Nets)和条件随机场(Conditional Random Fields),以显式建模那些不确定性。其中的关键成分之一是高阶条件随机场项(high-order CRF terms),这些项能够建模潜在的遮挡情况,从而使我们的方法即使在存在大量人员的情况下也能保持鲁棒性。我们的模型采用了端到端训练方式,并且我们在具有挑战性的场景中展示了其优于多种现有最先进算法的性能。