16 天前

InfoGCN:基于人体骨骼的动作识别表示学习

{Karthik Ramani, QiXing Huang, Sang Wan Lee, Seunggeun Chi, Myoung Hoon Ha, Hyung-gun Chi}
InfoGCN:基于人体骨骼的动作识别表示学习
摘要

基于人体骨骼的动作识别为理解人类行为的复杂性提供了一种有效手段,因其能够捕捉物理约束与行为意图之间的复杂关系。尽管已有诸多研究致力于骨骼数据的编码,但较少工作关注如何将此类信息有效嵌入到人体动作的潜在表征中。为此,本文提出InfoGCN,一种结合新型学习目标与编码方法的动作识别学习框架。首先,我们设计了一种基于信息瓶颈(information bottleneck)的学习目标,引导模型学习具有信息量且紧凑的潜在表征。为提升动作分类的判别能力,我们引入基于注意力机制的图卷积网络,以捕捉人体动作中依赖上下文的内在拓扑结构。此外,我们提出一种基于关节相对位置的多模态骨骼表示方法,旨在为关节提供互补的空间信息。在多个基于骨骼的动作识别基准测试中,InfoGCN均超越了现有最先进方法,在NTU RGB+D 60跨被试划分上达到93.0%的准确率,在NTU RGB+D 120跨被试划分上达到89.8%的准确率,在NW-UCLA数据集上达到97.0%的准确率。

InfoGCN:基于人体骨骼的动作识别表示学习 | 最新论文 | HyperAI超神经