
摘要
近年来的多项研究表明,深度卷积神经网络生成的图像描述子在图像分类与图像检索任务中均达到了当前最优性能。此外,已有研究证实,卷积层的激活值可被解释为描述图像特定区域的局部特征。这些局部特征可采用专为传统局部特征设计的聚合方法(如Fisher向量)进行整合,从而构建出新型且强大的全局描述子。本文探讨了将深度局部特征进行聚合以生成紧凑型图像检索描述子的多种可行方法。首先,我们发现深度特征与传统手工设计特征在成对相似性分布上存在显著差异,因此必须对现有的聚合方法进行审慎的重新评估。这一重新评估表明,与浅层特征不同,基于求和池化(sum pooling)的简单聚合方法在深度卷积特征上表现最佳。该方法计算高效、参数极少,在学习主成分分析(PCA)矩阵等过程中也具有较低的过拟合风险。此外,本文还提出了一种简单而高效的查询扩展(query expansion)策略,适用于所提出的聚合方法。总体而言,所提出的新型紧凑型全局描述子在四个常用基准测试上均显著提升了当前最优性能。