17 天前

代理锚点损失用于深度度量学习

Sungyeon Kim, Dongwon Kim, Minsu Cho, Suha Kwak
代理锚点损失用于深度度量学习
摘要

现有的度量学习损失函数可分为两类:基于样本对(pair-based)和基于代理(proxy-based)的损失。前者能够利用数据点之间的细粒度语义关系,但由于训练复杂度较高,通常导致收敛速度较慢;相比之下,后者能够实现快速且可靠的收敛,但难以捕捉数据之间的丰富关联关系。本文提出一种新型的基于代理的损失函数,兼具两类方法的优势,同时克服了各自的局限性。得益于代理机制的引入,所提损失函数显著提升了收敛速度,并对噪声标签和异常值具有较强的鲁棒性。与此同时,该方法在梯度计算中允许数据的嵌入向量之间相互作用,从而有效挖掘数据间的关联关系。我们在四个公开基准数据集上对所提方法进行了评估,实验结果表明,使用该损失函数训练的标准网络不仅达到了当前最优的性能表现,而且收敛速度最快。