
摘要
现有的行人重识别(re-id)方法要么假设模型输入为对齐良好的行人边界框图像,要么依赖于受限的注意力选择机制来校正未对齐的图像。因此,这些方法在处理具有较大姿态变化和无约束自动检测误差的任意对齐行人图像时效果不佳。在这项工作中,我们展示了通过最大化不同层次视觉注意力的互补信息,并在行人重识别判别学习约束下联合学习注意力选择和特征表示的优势。具体而言,我们提出了一种新颖的和谐注意力卷积神经网络(Harmonious Attention CNN, HA-CNN)模型,用于同时学习软像素注意力和硬区域注意力,并同步优化特征表示,旨在优化不受控制(未对齐)图像中的行人重识别。广泛的对比评估验证了该新的HA-CNN模型在三个大规模基准数据集CUHK03、Market-1501和DukeMTMC-ReID上优于多种最先进的行人重识别方法。