
摘要
近年来,由于深度传感器的普及以及实时基于深度的三维骨骼估计算法的发展,基于骨骼的人体动作识别受到了多个研究领域的广泛关注。在本研究中,我们采用滚动映射(rolling maps)方法,从三维骨骼数据中识别人体动作。滚动映射是一个定义明确的数学概念,但在视觉领域尚未得到充分探索。首先,我们通过不同身体部位之间的相对三维旋转来表示每个骨骼结构。由于三维旋转属于特殊正交群 SO(3),因此我们的骨骼表示可视为位于李群 SO(3) × … × SO(3) 中的一个点,而该空间本身也是一个黎曼流形。基于这一表示,我们将人体动作建模为该李群中的曲线。然而,在非欧几里得空间中对曲线进行分类是一项具有挑战性的任务。为此,我们结合对数映射(logarithm map)与滚动映射技术,将动作曲线展开至李代数 so(3) × … × so(3)(该空间为向量空间),并在李代数空间中完成分类。在三个动作识别数据集上的实验结果表明,所提出的方法在性能上达到或优于当前最先进的技术水平。