8 个月前

视觉文档检索

计算机视觉

Andrew Zisserman Relja Arandjelović

摘要

本研究的目标是在大规模图像数据集上实现基于图像查询的物体检索，要求在运行时能够即时完成检索，其方式类似于 Video Google [28]。本文提出以下三项主要贡献：(i) 提出一种新的 SIFT 描述子比较方法——RootSIFT，该方法在不增加计算或存储开销的前提下，显著提升了性能；(ii) 提出一种新颖的查询扩展方法，通过高效利用倒排索引，以适合即时检索的形式，判别性地学习更丰富的查询模型；(iii) 改进了 Turcot 与 Lowe [29] 提出的图像增强方法，仅保留与增强后图像在空间上保持一致的增强特征。我们在多个标准基准数据集（牛津建筑 5k 和 105k，以及巴黎 6k）上对上述三种方法进行了评估，结果表明，在保持即时检索速度的同时，检索性能得到了显著提升。将这些互补方法相结合，使得本方法在上述数据集上达到了新的最先进水平。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

视觉文档检索

计算机视觉

Andrew Zisserman Relja Arandjelović

摘要

本研究的目标是在大规模图像数据集上实现基于图像查询的物体检索，要求在运行时能够即时完成检索，其方式类似于 Video Google [28]。本文提出以下三项主要贡献：(i) 提出一种新的 SIFT 描述子比较方法——RootSIFT，该方法在不增加计算或存储开销的前提下，显著提升了性能；(ii) 提出一种新颖的查询扩展方法，通过高效利用倒排索引，以适合即时检索的形式，判别性地学习更丰富的查询模型；(iii) 改进了 Turcot 与 Lowe [29] 提出的图像增强方法，仅保留与增强后图像在空间上保持一致的增强特征。我们在多个标准基准数据集（牛津建筑 5k 和 105k，以及巴黎 6k）上对上述三种方法进行了评估，结果表明，在保持即时检索速度的同时，检索性能得到了显著提升。将这些互补方法相结合，使得本方法在上述数据集上达到了新的最先进水平。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供