17 天前

基于噪声标签的大规模预训练用于行人重识别

Dengpan Fu, Dongdong Chen, Hao Yang, Jianmin Bao, Lu Yuan, Lei Zhang, Houqiang Li, Fang Wen, Dong Chen
基于噪声标签的大规模预训练用于行人重识别
摘要

本文旨在解决行人重识别(Person Re-Identification, Re-ID)中存在噪声标签的预训练问题。为构建预训练任务,我们在现有未标注Re-ID数据集“LUPerson”的原始视频上应用了一个简单的在线多目标跟踪系统,由此生成带有噪声标签的变体数据集,命名为“LUPerson-NL”。由于这些ID标签由轨迹片段(tracklets)自动推导而来,不可避免地包含噪声。为此,我们提出了一种基于噪声标签的大规模预训练框架——PNL(Pre-training with Noisy Labels),该框架包含三个学习模块:监督式Re-ID学习、基于原型的对比学习,以及标签引导的对比学习。原则上,这三个模块的联合学习不仅能够将相似样本聚类至同一原型,还能基于原型分配结果对噪声标签进行修正。我们证明,直接从原始视频中进行学习是一种极具潜力的预训练替代方案,其利用空间与时间相关性作为弱监督信号。这一简洁的预训练任务为在“LUPerson-NL”数据集上从零开始学习当前最优(SOTA)Re-ID表征提供了可扩展的途径,无需依赖复杂的技巧。例如,在采用相同的监督式Re-ID方法MGN时,我们的预训练模型在CUHK03、DukeMTMC和MSMT17三个数据集上,分别相较无监督预训练方法提升了5.7%、2.2%和2.3%的mAP。在小样本或少样本设置下,性能提升更为显著,表明所学习表征具有更强的可迁移性。代码已开源,地址为:https://github.com/DengpanFu/LUPerson-NL