
摘要
从判别性局部区域学习特征表示在细粒度视觉分类中起着关键作用。利用注意力机制提取局部特征已成为当前主流方法。然而,现有方法存在两大局限:其一,通常只关注最显著的局部区域,而忽视了那些虽不显眼但具有判别性的其他部分;其二,将不同局部特征视为孤立个体,忽略了它们之间的内在关联。为克服上述问题,我们提出一种显式定位多个具有区分性的局部区域并探索其相互关系的方法。为此,我们设计了两个轻量级模块,可无缝集成至现有的卷积神经网络中。一方面,我们提出特征增强与抑制模块,通过增强特征图中最显著部分以获得特定局部的表示,同时抑制该部分,迫使后续网络挖掘其他潜在的局部区域;另一方面,引入特征多样化模块,从相关联的局部特定表示中学习语义上互补的信息。所提方法无需边界框或部件标注,支持端到端训练。大量实验结果表明,该方法在多个主流细粒度图像分类数据集上均取得了当前最优性能。源代码已开源,地址为:https://github.com/chaomaer/FBSD。