
摘要
在过去的几年中,计算机视觉领域经历了一场主要由大规模数据集的出现和深度卷积神经网络用于端到端学习所推动的革命。人员再识别子领域也不例外。不幸的是,社区中普遍存在一种观点,即三元组损失(triplet loss)不如使用代理损失(分类、验证)后再进行单独的度量学习步骤。我们证明了,无论是从头开始训练的模型还是预训练的模型,使用三元组损失的一种变体进行端到端的深度度量学习都能大幅超越大多数其他已发表的方法。
在过去的几年中,计算机视觉领域经历了一场主要由大规模数据集的出现和深度卷积神经网络用于端到端学习所推动的革命。人员再识别子领域也不例外。不幸的是,社区中普遍存在一种观点,即三元组损失(triplet loss)不如使用代理损失(分类、验证)后再进行单独的度量学习步骤。我们证明了,无论是从头开始训练的模型还是预训练的模型,使用三元组损失的一种变体进行端到端的深度度量学习都能大幅超越大多数其他已发表的方法。