16 天前

提升目标检索的三项关键认知

{Andrew Zisserman, Relja Arandjelović}
摘要

本研究的目标是在大规模图像数据集上实现基于图像查询的物体检索,要求在运行时能够即时完成检索,其方式类似于 Video Google [28]。本文提出以下三项主要贡献:(i) 提出一种新的 SIFT 描述子比较方法——RootSIFT,该方法在不增加计算或存储开销的前提下,显著提升了性能;(ii) 提出一种新颖的查询扩展方法,通过高效利用倒排索引,以适合即时检索的形式,判别性地学习更丰富的查询模型;(iii) 改进了 Turcot 与 Lowe [29] 提出的图像增强方法,仅保留与增强后图像在空间上保持一致的增强特征。我们在多个标准基准数据集(牛津建筑 5k 和 105k,以及巴黎 6k)上对上述三种方法进行了评估,结果表明,在保持即时检索速度的同时,检索性能得到了显著提升。将这些互补方法相结合,使得本方法在上述数据集上达到了新的最先进水平。

提升目标检索的三项关键认知 | 最新论文 | HyperAI超神经