17 天前

面向3D人体姿态估计的网络结构优化

{ Yizhou Wang, Xiaoxuan Ma, Chunyu Wang, Hai Ci}
面向3D人体姿态估计的网络结构优化
摘要

人体姿态自然地可以表示为一个图结构,其中关节点作为节点,骨骼作为边。因此,将图卷积网络(Graph Convolutional Network, GCN)应用于从2D姿态估计3D姿态是十分自然的。在本工作中,我们提出了一种通用的建模框架,该框架包含GCN和全连接网络(Fully Connected Network, FCN)作为其特例。基于这一通用框架,我们发现当用于3D姿态估计任务时,GCN的表示能力存在局限性。为此,我们引入了局部连接网络(Locally Connected Network, LCN),该网络可通过该通用框架自然实现,显著提升了模型的表示能力。此外,由于每个关节点仅与邻近的少数关节点相连,该方法具有较强的泛化能力。在多个公开数据集上的实验结果表明,该方法具备以下优势:(1)性能超越现有最先进方法;(2)相较于其他模型,对数据的需求更少;(3)在未见动作和不同数据集上均表现出良好的泛化性能。