2 个月前

用于人员再识别的人类语义解析

Mahdi M. Kalayeh; Emrah Basaran; Muhittin Gokmen; Mustafa E. Kamasak; Mubarak Shah
用于人员再识别的人类语义解析
摘要

人员再识别是一项具有挑战性的任务,主要由于背景杂乱、姿态、光照和摄像机视角的变化等因素的影响。这些因素阻碍了稳健且具有区分性的特征表示的提取,从而妨碍了不同身份的成功区分。为了改进特征学习,通常会从人体部位中提取局部特征。然而,这种过程的常用方法是基于边界框部位检测。在本文中,我们提出采用人体语义解析(human semantic parsing),由于其像素级精度和建模任意轮廓的能力,自然成为更好的替代方案。我们提出的SPReID方法将人体语义解析集成到人员再识别中,不仅显著优于基线方法,还达到了当前最先进的性能。此外,我们展示了通过采用一种简单但有效的训练策略,标准的流行深度卷积架构如Inception-V3和ResNet-152,在不进行任何修改的情况下,仅对整幅图像进行操作,就能大幅超越当前的最先进水平。我们的方法在以下数据集上提升了最先进的人员再识别性能:Market-1501数据集上的mAP提高了约17%,rank-1提高了约6%;CUHK03数据集上的rank-1提高了约4%;DukeMTMC-reID数据集上的mAP提高了约24%,rank-1提高了约10%。