摘要
基于视频的人体再识别(Person Re-Identification, Re-ID)是一项具有挑战性的任务,旨在通过视频序列在不同摄像头之间匹配同一个体。尽管现有大多数Re-ID方法仅依赖外观特征,但研究表明,引入步态信息有望进一步提升人体再识别系统的性能。为此,本文提出一种新型方法——GAF-Net,该方法将外观特征与步态特征相结合,实现个体的精准再识别:其中,外观特征从RGB轨迹片段(RGB tracklets)中提取,而步态特征则通过骨骼姿态估计获得。随后,两类特征被融合为单一综合特征表示,用于后续的再识别任务。在iLIDS-Vid数据集上的大量实验结果表明,骨骼步态特征能够有效提升人体再识别系统的性能。此外,通过在GAF-Net框架中引入当前先进的PiT(Perceiver Image Transformer)网络,系统在rank-1和rank-5准确率上分别提升了1个百分点,进一步验证了所提方法的有效性与优越性。