11 天前

基于多列卷积神经网络的单图像人群计数

{Siqin Chen, Shenghua Gao, Yi Ma, Yingying Zhang, Desen Zhou}
基于多列卷积神经网络的单图像人群计数
摘要

本文旨在提出一种能够准确估计任意人群密度及任意视角下单张图像中人群数量的方法。为此,我们设计了一种简单而有效的多列卷积神经网络(Multi-column Convolutional Neural Network, MCNN)架构,用于将输入图像映射为其对应的人群密度图。所提出的MCNN模型可接受任意尺寸或分辨率的输入图像。通过采用感受野大小不同的卷积核,各列卷积神经网络所提取的特征能够自适应地应对因视角变化或图像分辨率差异导致的人体/头部尺寸变化。此外,基于几何自适应核函数,可精确计算真实密度图,且无需事先知晓输入图像的视角映射信息。由于现有主流人群计数数据集未能充分涵盖本文所考虑的所有复杂场景,我们收集并标注了一个大规模的新数据集,包含1198张图像,共计约33万个人头标注。在该具有挑战性的新数据集以及所有现有公开数据集上,我们开展了大量实验,以验证所提模型与方法的有效性。实验结果表明,仅采用所提出的简单MCNN模型,本方法在各项指标上均优于现有所有方法。此外,实验还显示,该模型在某一数据集上训练完成后,可轻松迁移至新的数据集上,展现出良好的泛化能力。

基于多列卷积神经网络的单图像人群计数 | 最新论文 | HyperAI超神经