17 天前

用于细粒度汽车识别的具有空间加权池化的深度CNN

{Chunhua Shen, Teng Li, Huibing Wang, Qichang Hu}
摘要

细粒度车辆识别旨在识别车辆的类别信息,例如品牌、型号,甚至生产年份。近年来,大量研究表明,基于大规模数据集训练的深度卷积神经网络(DCNN)在多种通用物体分类任务中能够取得令人瞩目的性能。本文提出一种空间加权池化(Spatially Weighted Pooling, SWP)策略,显著提升了主流DCNN模型特征表示的鲁棒性与有效性。具体而言,SWP是一种新型池化层,包含预定义数量的空间加权掩码(或称池化通道)。该层在池化DCNN提取的特征时,利用其学习得到的掩码进行引导,从而衡量特征图中各空间单元在判别能力上的重要性。与现有在DCNN卷积特征图上采用均匀网格池化的方法相比,所提出的方法能够仅通过单一DCNN即可提取卷积特征并生成池化通道,因此在实现上仅需极少修改。此外,SWP层的参数可在DCNN的端到端训练过程中进行联合学习。我们将该方法应用于多个细粒度车辆识别数据集,实验结果表明,所提方法在性能上优于现有主流方法。在Stanford Cars-196数据集上,准确率从92.6%提升至93.1%;在最新的CompCars数据集上,准确率从91.2%显著提升至97.6%,进一步推动了该领域的技术水平。此外,我们在两个额外的大规模数据集上也进行了测试,均取得了令人瞩目的效果。