摘要
行人重识别(Person Re-Identification, ReID)是一项具有挑战性的计算机视觉任务,旨在在无法获取人脸信息的情况下识别或验证一个或多个行人。在ReID任务中,难以区分的背景通常会干扰模型对前景的感知,从而降低识别性能。一般而言,同一摄像头拍摄的背景具有较高的相似性,而不同摄像头之间的背景则存在显著差异。基于这一观察,本文提出了一种模板感知的Transformer方法(Template-aware Transformer, TAT),通过在Transformer结构中引入可学习的模板,使模型能够学习样本间的不可区分特征,并减少对低区分度区域(如背景和遮挡区域)的关注。在编码器的多头注意力模块中,该模板引导模型关注图像中不可区分的特征,并随着编码器块的加深,逐步增强对可区分特征的注意力。此外,考虑到ReID任务的特性,我们利用辅助信息增加模板的数量,以提升模型对不同摄像头ID下显著变化背景的适应能力。实验结果表明,所提出的理论在多个公开数据集上均具有有效性,并通过定量评估取得了具有竞争力的性能表现。