摘要
弱监督细粒度图像分类(Weakly Supervised Fine-grained Image Classification, WFGIC)的核心在于如何准确识别出具有判别性的图像区域,并从中学习到有效的判别性特征。然而,当前大多数WFGIC方法独立地选择判别性区域,并直接利用其特征,忽视了区域特征之间存在语义相关性,且区域组合往往比单个区域更具判别能力这一事实。为解决上述问题,本文提出一种端到端的图传播式相关性学习(Graph-propagation based Correlation Learning, GCL)模型,旨在充分挖掘并利用区域间相关性所蕴含的判别潜力,以提升WFGIC性能。具体而言,在判别性区域定位阶段,我们设计了一种十字交叉图传播(Criss-cross Graph Propagation, CGP)子网络,用于建模区域间的相关性。该网络通过建立区域之间的关联关系,以十字交叉的方式加权聚合其他区域的信息,从而增强每个区域的表征能力。该机制使得每个区域的特征同时编码了全局图像上下文与局部空间上下文信息,从而引导网络隐式地发现更具判别力的区域组合,提升细粒度分类效果。在判别性特征表示阶段,我们进一步提出相关性特征增强(Correlation Feature Strengthening, CFS)子网络,用于挖掘判别性图像块特征向量之间的内在语义相关性。该模块通过迭代式地强化具有信息量的特征元素,同时抑制冗余或无用成分,从而显著提升特征的判别能力。大量实验结果验证了CGP与CFS子网络的有效性,表明所提出的GCL模型在分类准确率与计算效率方面均优于现有方法,显著提升了弱监督细粒度图像分类的整体性能。