
摘要
本文针对无监督视频行人重识别(re-ID)中从类别不平衡的未标注数据中估计标签所面临的可扩展性与鲁棒性问题,提出了一种基于深度特征表示学习的新型鲁棒锚点嵌入(Robust AnChor Embedding, RACE)框架,以实现大规模无监督视频重识别。在该框架中,首先选取代表不同行人的锚点序列,构建锚点图,并以此初始化卷积神经网络(CNN)模型,从而获得具有判别性的特征表示,为后续标签估计提供基础。为从含有噪声帧的未标注序列中准确估计标签,本文引入基于正则化仿射壳(regularized affine hull)的鲁棒锚点嵌入方法。在流形假设下,采用k近邻锚点嵌入策略替代全部锚点集,有效保障了计算效率。随后,提出一种鲁棒且高效的top-k计数标签预测策略,用于预测未标注图像序列的标签。利用新估计的带标签序列,统一的锚点嵌入框架进一步推动了特征学习过程的优化。在大规模数据集上的大量实验结果表明,所提出的方法显著优于现有的无监督视频重识别方法。