
摘要
人员再识别(person re-ID)通常被视为图像检索问题。该任务旨在从大量图像库中搜索查询对象的行人。在实际应用中,人员再识别通常采用自动检测器来获取裁剪后的行人图像。然而,这一过程会受到两种类型的检测器错误的影响:背景过多和部分缺失。这两种错误都会降低行人的对齐质量,并可能由于位置和尺度的变化而影响行人的匹配效果。为了解决对齐问题,我们提出可以从识别过程中学习对齐方法。为此,我们引入了行人对齐网络(Pedestrian Alignment Network, PAN),该网络能够在无需额外注释的情况下进行判别嵌入学习和行人对齐。我们的关键观察是,当卷积神经网络(Convolutional Neural Network, CNN)学会区分不同的身份时,所学的特征图通常会在人体上表现出强烈的激活,而不是在背景上。因此,所提出的网络利用这种注意力机制自适应地定位并对齐边界框内的行人。视觉示例表明,使用PAN可以更好地对齐行人。在三个大规模再识别数据集上的实验结果证实,PAN提高了特征嵌入的判别能力,并且其准确性与现有最先进方法相当。