
摘要
一个人通常通过身高、体型、衣物颜色、衣物类型和性别等属性来描述。这些属性被称为软生物特征(soft biometrics)。它们弥合了人类描述与监控视频中人员检索之间的语义差距。本文提出了一种基于深度学习的线性滤波方法,利用身高、衣物颜色和性别进行人员检索。该方法使用Mask R-CNN进行像素级人物分割,以去除背景杂乱并提供精确的人物边界。颜色和性别模型则通过微调AlexNet实现,算法在SoftBioSearch数据集上进行了测试,在具有挑战性的条件下,使用语义查询进行人员检索时取得了良好的准确性。