7 个月前

卷积神经网络

视觉文档检索

计算机视觉

Artem Babenko Victor Lempitsky

摘要

几项最近的研究表明，由深度卷积神经网络生成的图像描述符在图像分类和检索问题上提供了最先进的性能。此外，研究还发现，卷积层的激活可以被解释为描述特定图像区域的局部特征。这些局部特征可以使用为局部特征开发的聚合方法（例如Fisher向量）进行聚合，从而提供新的强大的全局描述符。本文中，我们探讨了将局部深度特征聚合以生成用于图像检索的紧凑全局描述符的可能方法。首先，我们展示了深度特征与传统手工设计特征之间的成对相似度分布存在显著差异，因此现有的聚合方法需要仔细重新评估。这种重新评估揭示了一个事实，即与浅层特征不同的是，基于求和池化的简单聚合方法对于深度卷积特征而言可能是最佳选择。该方法高效、参数少，并且在学习主成分分析矩阵时几乎不存在过拟合的风险。总体而言，新的紧凑全局描述符在四个常见的基准测试中显著提升了现有技术水平。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

视觉文档检索

计算机视觉

Artem Babenko Victor Lempitsky

摘要

几项最近的研究表明，由深度卷积神经网络生成的图像描述符在图像分类和检索问题上提供了最先进的性能。此外，研究还发现，卷积层的激活可以被解释为描述特定图像区域的局部特征。这些局部特征可以使用为局部特征开发的聚合方法（例如Fisher向量）进行聚合，从而提供新的强大的全局描述符。本文中，我们探讨了将局部深度特征聚合以生成用于图像检索的紧凑全局描述符的可能方法。首先，我们展示了深度特征与传统手工设计特征之间的成对相似度分布存在显著差异，因此现有的聚合方法需要仔细重新评估。这种重新评估揭示了一个事实，即与浅层特征不同的是，基于求和池化的简单聚合方法对于深度卷积特征而言可能是最佳选择。该方法高效、参数少，并且在学习主成分分析矩阵时几乎不存在过拟合的风险。总体而言，新的紧凑全局描述符在四个常见的基准测试中显著提升了现有技术水平。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供