7 天前

k阶召回率代理损失与大批次及相似性混合策略

Yash Patel, Giorgos Tolias, Jiri Matas
k阶召回率代理损失与大批次及相似性混合策略
摘要

本研究聚焦于通过探索一种新型损失函数、批量大小与新型正则化方法之间的相互作用,学习用于图像检索的深层视觉表征模型。由于召回率(recall)这一评估指标在检索任务中通常不可导,因此无法直接通过梯度下降等方法对其进行优化。为此,本文提出了一种针对召回率的可微分代理损失函数(surrogate loss)。通过采用一种规避GPU内存硬件限制的实现方式,该方法能够以极大规模的批量进行训练,这对于在完整检索数据库上计算评估指标而言至关重要。此外,该方法还引入了一种高效的Mixup正则化策略,该策略作用于成对的标量相似度上,可虚拟地进一步扩大有效批量大小。实验结果表明,当应用于深度度量学习时,该方法在多个图像检索基准测试中取得了当前最优的性能表现。特别是在实例级识别任务中,该方法优于那些基于平均精度(average precision)近似值进行训练的同类方法。