16 天前

基于分割引导注意力网络与课程损失的群体计数

Qian Wang, Toby P. Breckon
基于分割引导注意力网络与课程损失的群体计数
摘要

自动人群行为分析是智能交通系统实现有效人流调控与动态路径规划的关键任务,尤其针对道路参与者构成多变的场景具有重要意义。人群计数作为自动人群行为分析的核心环节,近年来在深度卷积神经网络(CNN)的推动下取得了令人瞩目的进展。研究者们投入大量精力致力于多样化CNN架构的设计,其中多数方法基于预训练的VGG16模型构建。然而,由于VGG16主干网络表达能力有限,通常需在其后接一个专门设计的复杂附加网络,以提升计数性能。尽管在图像分类任务中Inception模型已超越VGG系列,但现有基于Inception模块的人群计数网络仍仅采用少量基础类型的Inception模块,结构深度与多样性不足。为弥补这一空白,本文首先在常用的人群计数数据集上对基准Inception-v3模型进行了全面评估,结果表明其性能出人意料地优异,可与甚至超越多数现有计数模型。在此基础上,我们进一步推进该技术边界,提出一种以Inception-v3为骨干网络、并引入新型课程损失(curriculum loss)的分割引导注意力网络(Segmentation Guided Attention Network, SGANet)。通过大量实验对比,验证了所提方法的优越性:在ShanghaiTechA、ShanghaiTechB和UCF_QNRF三个标准数据集上,SGANet分别取得了57.6、6.3和87.6的平均绝对误差(MAE),达到当前最优水平,显著提升了人群计数的精度与鲁棒性。

基于分割引导注意力网络与课程损失的群体计数 | 最新论文 | HyperAI超神经