2 个月前

使用上下文金字塔CNN生成高质量人群密度图

Vishwanath A. Sindagi; Vishal M. Patel
使用上下文金字塔CNN生成高质量人群密度图
摘要

我们提出了一种名为上下文金字塔卷积神经网络(Contextual Pyramid CNN,简称CP-CNN)的新方法,通过显式地融合人群图像的全局和局部上下文信息来生成高质量的人群密度和人数估计。所提出的CP-CNN由四个模块组成:全局上下文估计器(Global Context Estimator,简称GCE)、局部上下文估计器(Local Context Estimator,简称LCE)、密度图估计器(Density Map Estimator,简称DME)和融合卷积神经网络(Fusion-CNN,简称F-CNN)。GCE基于VGG-16架构的卷积神经网络,用于编码全局上下文信息,并训练其将输入图像分类为不同的密度等级;而LCE是另一个卷积神经网络,用于编码局部上下文信息,并训练其对输入图像进行分块分类为不同的密度等级。DME采用多列架构的卷积神经网络,旨在从输入图像中生成高维特征图,并通过F-CNN将这些特征图与GCE和LCE估计的上下文信息进行融合。为了生成高分辨率和高质量的密度图,F-CNN使用了一系列卷积层和分数步长卷积层,并与DME一起以端到端的方式进行训练,采用了对抗损失和像素级欧氏损失的组合。在极具挑战性的数据集上进行的大量实验表明,所提出的方法相比现有最先进方法取得了显著改进。

使用上下文金字塔CNN生成高质量人群密度图 | 最新论文 | HyperAI超神经