
摘要
在本研究中,我们提出了一种端到端的约束聚类方案,以解决行人重识别(re-id)问题。近年来,深度神经网络(DNN)在行人重识别任务上已被证明是有效的。特别是,通过端到端的方式扩散画廊图像之间的相似性,已被证明可以生成稳健的探针-画廊亲和力,而不仅仅是依赖于探针-画廊相似性。然而,现有的方法并未将探针图像作为约束条件,并且在相似性扩散过程中容易受到噪声传播的影响。为了解决这一问题,我们提出了一种新颖的方案,将行人图像检索问题视为一个约束聚类优化问题,称为深度约束主导集(DCDS)。给定探针图像和画廊图像后,我们将行人重识别问题重新表述为寻找一个受约束的聚类集,其中探针图像是作为约束(种子),每个聚类集对应于同一行人的图像集合。通过端到端地优化约束聚类过程,我们可以自然地利用与给定行人图像相关的图像集合的上下文知识。此外,为了进一步提升性能,我们在DCDS中集成了一个辅助网络,该网络采用了多尺度ResNet架构。为了验证我们方法的有效性,我们在多个基准数据集上进行了实验,并展示了所提出的方案能够超越现有最先进方法。