
摘要
近年来,人类动作分类研究取得了显著进展。大多数深度学习方法通过增加网络组件来提升性能。然而,本文提出应更充分地利用辅助机制,包括分层分类、网络剪枝以及基于骨架的预处理方法,以增强模型的鲁棒性与性能。我们在四个常用基准数据集上验证了所提方法的有效性:NTU RGB+D 60、NTU RGB+D 120、Northwestern-UCLA 多视角动作3D数据集以及UTD多模态人类动作数据集。实验结果表明,所提方法在全部四个数据集上均能达到相当或更优的性能表现。尤其值得注意的是,该方法在四者中规模最大的NTU RGB+D 120数据集上建立了新的基准性能。此外,我们通过大量对比实验与消融研究,对所提方法进行了深入分析。