
摘要
在密集人群场景中估计人群数量是一项极具挑战性的任务,主要是由于尺度变化的非均匀性。本文提出了一种新颖的端到端级联卷积神经网络(CNN)架构,用于联合学习人群计数分类和密度图估计。将人群数量分类为不同的组别,相当于对图像中的总人数进行粗略估计,从而将高层次先验信息融入密度估计网络中。这使得网络中的各层能够学习全局相关的判别特征,有助于生成高精度的密度图并降低计数误差。联合训练以端到端的方式进行。在多个公开且极具挑战性的数据集上进行的大量实验表明,所提出的方法相比最近的先进方法,在计数误差和密度图质量方面均取得了更好的效果。