17 天前
AMES:面向实例级检索的非对称且内存高效相似性估计
Pavel Suma, Giorgos Kordopatis-Zilos, Ahmet Iscen, Giorgos Tolias

摘要
本研究针对实例级图像检索重排序问题,在内存效率约束条件下展开探讨,最终目标是将每张图像的内存占用控制在1KB以内。与当前主流研究侧重于性能提升不同,本工作更关注性能与内存需求之间的关键权衡。所提出的模型采用基于Transformer的架构,通过捕捉图像内部及图像之间的局部描述子交互关系,实现图像间相似性的精确估计。该模型的一个显著特性在于支持非对称相似性计算:在数据库图像中使用比查询图像更少的描述子进行表示,从而在不增加内存消耗的前提下实现性能提升。为确保模型在不同应用场景下的适应性,本文进一步引入一种通用型模型,可在测试阶段动态调整局部描述子的数量。在标准基准测试上的实验结果表明,本方法在性能上显著优于传统手工设计模型与现有学习型模型。尤其值得注意的是,相较于当前主流方法普遍忽略其内存开销的现状,本方法不仅取得了更优的检索性能,同时实现了显著更低的内存占用。相关代码与预训练模型已公开发布于:https://github.com/pavelsuma/ames