11 天前

动态GCN:基于骨架动作识别的上下文增强拓扑学习

Fanfan Ye, Shiliang Pu, Qiaoyong Zhong, Chao Li, Di Xie, Huiming Tang
动态GCN:基于骨架动作识别的上下文增强拓扑学习
摘要

图卷积网络(Graph Convolutional Networks, GCNs)在基于骨架的动作识别任务中受到了越来越多的关注。其核心在于图结构的设计,该结构用于编码骨架的拓扑信息。本文提出了一种动态图卷积网络(Dynamic GCN),其中引入了一种新型卷积神经网络——上下文编码网络(Context-encoding Network, CeN),用于自动学习骨架的拓扑结构。具体而言,在建模两个关节之间的依赖关系时,CeN以全局方式融合其余关节的上下文特征。CeN结构极为轻量化且高效,可无缝嵌入到图卷积层中。通过堆叠多个由CeN增强的图卷积层,构建出Dynamic GCN。值得注意的是,得益于CeN的设计优势,不同输入样本以及不同深度的图卷积层均可生成动态变化的图拓扑结构。此外,本文还系统探索了三种替代性的上下文建模架构,为未来图拓扑学习的研究提供了有益的参考。与基线模型相比,CeN仅带来约7%的额外浮点运算量(FLOPs),而Dynamic GCN在性能上优于现有方法的同时,其计算开销仅为后者的$2\times$至$4\times$。通过进一步融合静态物理身体连接关系与运动模态信息,本方法在三个大规模基准数据集(NTU-RGB+D、NTU-RGB+D 120 和 Skeleton-Kinetics)上均取得了当前最优的识别性能。

动态GCN:基于骨架动作识别的上下文增强拓扑学习 | 最新论文 | HyperAI超神经