17 天前

细粒度图像识别中的选择性稀疏采样

{ Jianbin Jiao, Qixiang Ye, Yi Zhu, Yanzhao Zhou, Yao Ding}
细粒度图像识别中的选择性稀疏采样
摘要

细粒度识别面临的一个独特挑战是在存在显著类内差异的情况下,捕捉细微的类间差异(例如,不同鸟类物种的喙部特征)。传统方法通常通过裁剪局部区域并从中学习细节表征,但这类方法受限于固定数量的部件,且容易丢失周围上下文信息。本文提出一种简单而有效的框架——选择性稀疏采样(Selective Sparse Sampling),以捕捉多样且精细的细节。该框架基于卷积神经网络实现,称为选择性稀疏采样网络(Selective Sparse Sampling Networks, S3Ns)。在图像级监督下,S3Ns从类别响应图中提取峰值(即局部最大值),用于估计具有信息量的感受野,并学习一组稀疏注意力机制,以捕捉精细视觉证据的同时保留上下文信息。随后,对这些证据进行选择性采样,从而提取出具有判别性且互补的特征,显著丰富了网络所学的表征,并引导模型发现更细微的判别线索。大量实验与消融研究结果表明,所提出的方法在多个具有挑战性的基准数据集(包括 CUB-200-2011、FGVC-Aircraft 和 Stanford Cars)上均持续优于当前最先进的方法。

细粒度图像识别中的选择性稀疏采样 | 最新论文 | HyperAI超神经