
摘要
基于部件的细粒度识别方法虽然明确聚焦于区分高度相似类别时至关重要的细微特征,但其性能提升并未达到预期,相较于全局方法并无显著优势。我们推测,这主要是由于基于部件的方法在局部特征的表征上存在不足:无法实现对部件顺序无关的特征表达,且难以妥善处理可见部件数量变化的问题。部件的排列顺序本质上是人为设定的,通常仅依赖于真实标注信息,而视角变化与遮挡现象则会导致部分部件不可见。为此,我们提出将部件特征的Fisher向量编码引入卷积神经网络中。该编码的参数通过在线EM算法与神经网络参数联合优化,其估计精度优于以往方法。实验结果表明,该方法显著提升了三个鸟类物种分类数据集上的当前最优准确率。