
摘要
基于商品化深度传感器提供的深度信息进行人体动作识别是一项重要但极具挑战性的任务。深度图中的噪声、动作序列长度的差异以及动作执行风格的自由性,均可能导致类内差异显著增大。针对这一问题,本文提出了一种基于稀疏编码与时间金字塔匹配(Temporal Pyramid Matching, TPM)的新框架,用于深度信息驱动的人体动作识别。特别地,本文提出了一种判别性类别特定字典学习算法,用于稀疏编码。通过引入组稀疏性约束与几何结构约束,使得属于同一类别的子字典能够更准确地重构特征,同时在计算得到的系数中有效保留了特征之间的几何关系。所提方法在两个由深度摄像头采集的基准数据集上进行了评估,实验结果表明,该算法在多次测试中均显著优于现有最先进方法。此外,所提出的字典学习方法在性能上也超越了经典的字典学习技术。