2 个月前
重温牛津和巴黎:大规模图像检索基准测试
Filip Radenović; Ahmet Iscen; Giorgos Tolias; Yannis Avrithis; Ondřej Chum

摘要
本文针对在标准且流行的Oxford 5k和Paris 6k数据集上进行图像检索基准测试时存在的问题进行了探讨。具体而言,我们关注了标注错误、数据集规模以及挑战难度等方面的问题:为这两个数据集创建了新的标注,特别注重了地面真值(ground truth)的可靠性。引入了三种不同难度的新协议,这些协议允许对不同方法进行公平比较,包括那些使用数据集预处理阶段的方法。对于每个数据集,我们引入了15个新的具有挑战性的查询。最后,选择了一个包含100万个经过半自动清理的干扰项(distractors)的新集合。在新基准上对现有最先进方法进行了广泛的对比评估。评估涵盖了从基于局部特征到现代卷积神经网络(CNN)的各种类型的方法。通过结合两种方法的优点,取得了最佳结果。最重要的是,图像检索远未得到解决。