
摘要
在人群计数任务中,每张训练图像包含多个个体,每个个体通过一个点进行标注。现有的人群计数方法通常需要使用高斯核对每个标注点进行平滑处理,或基于标注点估计每个像素的出现概率。本文表明,对标注点施加高斯平滑会损害模型的泛化性能。为此,我们提出了一种基于分布匹配的人群计数方法——DM-Count(Distribution Matching for Crowd Counting)。在DM-Count中,我们采用最优传输(Optimal Transport, OT)来衡量归一化预测密度图与归一化真实密度图之间的相似性。为稳定OT的计算过程,我们在模型中引入了总变差损失(Total Variation loss)。理论分析表明,DM-Count的泛化误差上界优于传统的高斯平滑方法。在平均绝对误差(Mean Absolute Error)指标上,DM-Count在两个大规模数据集UCF-QNRF和NWPU上显著优于此前的最先进方法,并在ShanghaiTech和UCF-CC50数据集上取得了当前最优的性能。相比已发表的最先进结果,DM-Count将误差降低了约16%。代码已开源,地址为:https://github.com/cvlab-stonybrook/DM-Count。