17 天前

无监督预训练在行人重识别中的应用

Dengpan Fu, Dongdong Chen, Jianmin Bao, Hao Yang, Lu Yuan, Lei Zhang, Houqiang Li, Dong Chen
无监督预训练在行人重识别中的应用
摘要

本文提出一个大规模无标注行人重识别(Re-ID)数据集“LUPerson”,并首次尝试通过无监督预训练来提升所学习行人Re-ID特征表示的泛化能力。这一工作旨在解决现有行人Re-ID数据集普遍规模有限的问题,其根源在于数据标注所需的人力成本极高。以往研究多借助在ImageNet上预训练的模型来缓解Re-ID数据不足的问题,但受限于ImageNet与行人Re-ID数据之间存在的显著域差异(domain gap),效果有限。LUPerson是一个包含超过20万身份、共计400万张图像的无标注数据集,其规模是现有最大Re-ID数据集的30倍,同时涵盖了更加多样的采集环境(如不同摄像头设置、场景类型等)。基于该数据集,我们从数据增强和对比损失(contrastive loss)两个角度,系统性地探究了学习高质量Re-ID特征的关键因素。在该大规模数据集上进行的无监督预训练,有效构建了一种通用性强的Re-ID特征表示,可显著提升各类现有行人Re-ID方法的性能。在多个基础模型框架中引入我们预训练的模型后,所提方法在四个广泛使用的Re-ID数据集(CUHK03、Market1501、DukeMTMC和MSMT17)上均取得了无需额外技巧(no bells and whistles)的当前最优结果。此外,实验结果表明,该方法在小规模目标数据集或少样本(few-shot)设置下的性能提升尤为显著。