6 个月前

摘要

通过引入行人属性识别（Pedestrian Attribute Recognition, PAR）技术，可为行人重识别（re-ID）监控系统增添文本搜索功能。将基于卷积神经网络（CNN）的PAR模块集成到re-ID模型中，能够在两个任务上均实现高效性能，然而目前鲜有研究聚焦于通过改进数据而非模型结构来提升性能。大多数现代多任务学习方法在固定数据集上采用新型网络架构以超越先前方法，却往往忽视了计算成本、部署难度以及模型泛化能力等实际因素。为系统性评估数据对PAR性能的影响，本研究提出一个基于图像的、部分分类属性数据集（CA-Duke），该数据集基于DukeMTMC-reID数据集，包含36,411张图像，涵盖74种行人属性。然而，当前方法在确定新增模块的最佳接入位置时仍缺乏系统性策略，通常依赖实验试错方式在基准模型上选择分支插入位置以构建多任务网络。为此，本研究进一步提出一种两阶段学习方法，通过引入一种名为“分离指数”（Separation Index, SI）的新度量指标，评估潜在特征空间中数据的可分性，从而识别将PAR模块嵌入预训练re-ID网络的最佳位置。实验结果表明，在属性识别与检索任务上，全面且基于图像的标注方式可使F1指标提升3.31%。此外，结合SI度量与预训练网络，可在PAR任务上达到当前最优（state-of-the-art）性能。

源 PDF 查看代码