16 天前

基于骨骼的动作识别的更强更快基线构建

Yi-Fan Song, Zhang Zhang, Caifeng Shan, Liang Wang
基于骨骼的动作识别的更强更快基线构建
摘要

骨架动作识别中的一个关键问题是如何在所有骨架关节上提取具有判别性的特征。然而,当前该任务的最先进(SOTA)模型往往结构过于复杂且参数量过大,导致模型训练与推理效率低下,显著增加了在大规模数据集上验证模型架构的成本。为解决上述问题,本文将近期先进的可分离卷积层嵌入到早期融合的多输入分支(Multiple Input Branches, MIB)网络中,构建了一个高效的基础图卷积网络(Graph Convolutional Network, GCN)架构,用于骨架动作识别。在此基础上,我们进一步设计了一种复合扩展策略,同步增加模型的宽度与深度,最终获得一系列兼具高精度与少量可训练参数的高效GCN基线模型,统称为EfficientGCN-Bx,其中“x”表示扩展系数。在两个大规模数据集(NTU RGB+D 60 和 NTU RGB+D 120)上,所提出的EfficientGCN-B4基线模型显著优于其他现有SOTA方法,例如在NTU 60数据集的跨被试(cross-subject)基准测试中达到了91.7%的准确率,同时模型体积比当前表现最佳的MS-G3D模型缩小3.15倍,推理速度提升3.21倍。项目源代码及预训练模型已开源,可在 https://github.com/yfsong0709/EfficientGCNv1 获取。

基于骨骼的动作识别的更强更快基线构建 | 最新论文 | HyperAI超神经