
摘要
我们提出了一种高效学习深度局部描述子的方法,用于实例级识别任务。该方法的训练仅需正负图像对样本,通过度量学习的方式对求和池化后的全局图像描述子进行优化。在推理阶段,局部描述子由网络内部组件的激活值提供。我们阐明了为何该方法能够学习到适用于经典高效匹配核方法进行图像相似性估计的局部描述子。实验验证分析了基于匹配核的当前最先进图像搜索方法在性能与内存开销之间的权衡关系。与现有局部描述子相比,所提出的描述子在两项实例级识别任务中表现更优,同时保持了更低的内存需求。实验结果表明,全局描述子在大规模场景下表现不足,而局部描述子具有不可或缺的作用。我们的方法在多个场景下达到了当前最优性能,甚至在使用如ResNet18这样小型骨干网络的情况下也能实现卓越效果。