16 天前

FusionCount:通过多尺度特征融合实现高效的群体计数

Yiming Ma, Victor Sanchez, Tanaya Guha
FusionCount:通过多尺度特征融合实现高效的群体计数
摘要

当前最先进的人群计数模型普遍采用编码器-解码器架构。图像首先通过编码器提取特征,随后为校正透视畸变,将最高层级的特征图输入额外模块以提取多尺度特征,再作为解码器的输入生成人群密度图。然而,在这些方法中,编码过程中早期阶段提取的特征未得到充分利用,而多尺度模块所能捕捉的感受野范围有限,且伴随较高的计算开销。本文提出一种新型人群计数架构——FusionCount,该架构通过自适应融合编码器输出的绝大多数特征,而非依赖额外的特征提取组件来获取多尺度信息,从而能够覆盖更广泛的感受野尺度,同时显著降低计算成本。此外,我们设计了一种新型通道压缩模块,在解码阶段能够有效提取显著性信息,进一步提升模型性能。在两个基准数据集上的实验结果表明,所提模型在保持更低计算复杂度的前提下,实现了当前最优的计数性能。

FusionCount:通过多尺度特征融合实现高效的群体计数 | 最新论文 | HyperAI超神经