
摘要
基于视频的人类行为识别目前是计算机视觉领域中最活跃的研究方向之一。多项研究表明,行为识别的性能在很大程度上取决于所提取的特征类型以及如何表示这些行为。自Kinect相机发布以来,文献中提出了大量基于Kinect的人类行为识别技术。然而,至今尚未有对这些基于Kinect的技术进行全面比较的研究,特别是在特征类型的分类下,如手工设计特征与深度学习特征、基于深度图的特征与基于骨架的特征之间的对比。本文中,我们分析并比较了十种最近提出的基于Kinect的行为识别算法,分别针对跨个体行为识别和跨视角行为识别进行了评估,使用了六个基准数据集。此外,我们还实现了并改进了一些这些技术,并将其变体纳入了比较范围。实验结果表明,大多数方法在跨个体行为识别上的表现优于跨视角行为识别;基于骨架的特征在跨视角识别中比基于深度图的特征更为鲁棒;而深度学习特征适用于大规模数据集。