18 天前
基于高斯混合模型导向的判别性学习的弱监督细粒度图像分类
{ Zezhou Li, Jianjun Li, Haojie Li, Shuhui Yang, Shijie Wang, Zhihui Wang}

摘要
现有的弱监督细粒度图像识别(Weakly Supervised Fine-Grained Image Recognition, WFGIR)方法通常直接从高层特征图中提取判别性区域。我们发现,由于卷积神经网络(Convolutional Neural Network, CNN)中局部感受野的堆叠操作,导致高层特征图中的判别性区域发生扩散,从而造成判别性区域定位不准确的问题。针对这一问题,本文提出一种端到端的判别性特征导向高斯混合模型(Discriminative Feature-oriented Gaussian Mixture Model, DF-GMM),以缓解判别性区域扩散现象,并更精准地捕捉细粒度细节。具体而言,DF-GMM由以下两个核心组件构成:1)低秩表示机制(Low-Rank Representation Mechanism, LRM),该机制通过在高层语义特征图中利用高斯混合模型(Gaussian Mixture Model, GMM)学习一组低秩判别性基向量,从而增强特征表示的判别能力;2)低秩表示重构机制(Low-Rank Representation Reorganization Mechanism, LR²M),该机制恢复与低秩判别性基向量相对应的空间信息,进而重建低秩特征图。该机制有效缓解了判别性区域扩散问题,实现了更精确的判别性区域定位。大量实验结果表明,在CUB-Bird、Stanford-Cars以及FGVC Aircraft三个主流细粒度图像识别数据集上,DF-GMM在与当前最先进方法相同设置条件下,均取得了最优性能,验证了其有效性与优越性。