
摘要
步态识别的目标是通过人体在运动过程中随时间变化的特征,学习其独特的时空模式。由于人体不同部位在行走时表现出不同的运动特性,直观的做法是分别建模各部位的时空模式。然而,现有的基于部件的方法通常将每一帧的特征图等分为固定水平条带,以获取局部部件。显然,这种基于条带划分的方法难以准确定位人体各部位。首先,不同身体部位可能出现在同一水平条带上(例如手臂与躯干),而同一部位在不同帧中也可能出现在不同的条带中(例如手部);其次,不同部位具有不同的尺度,甚至同一部位在不同帧中也可能呈现不同的位置和尺度;第三,各部位还表现出显著不同的运动模式(例如运动起始帧、位移频率以及持续时间等)。为解决上述问题,本文提出了一类新颖的3D局部操作,作为3D步态识别主干网络的通用构建模块。所提出的3D局部操作能够以自适应的空间与时间尺度、位置及长度,从序列中提取人体各部位的局部3D体素。通过这种方式,各部位的时空模式得以在特定于部件的尺度、位置、频率和持续时间下被有效学习。实验结果表明,所提出的3D局部卷积神经网络在多个主流步态识别数据集上均达到了当前最优性能。代码已开源,地址为:https://github.com/yellowtownhz/3DLocalCNN。