2 个月前

学习用于人体姿态估计的特征金字塔

Wei Yang; Shuang Li; Wanli Ouyang; Hongsheng Li; Xiaogang Wang
学习用于人体姿态估计的特征金字塔
摘要

人体姿态估计是计算机视觉中的一个基本而具有挑战性的任务。当摄像机视角变化或出现严重透视缩短时,人体部位的尺度变化尤为显著,增加了任务的难度。尽管金字塔方法在推理阶段被广泛用于处理尺度变化,但在深度卷积神经网络(DCNNs)中学习特征金字塔仍是一个未充分探索的领域。在这项工作中,我们设计了一种金字塔残差模块(PRMs),以增强DCNNs对不同尺度的不变性。给定输入特征,PRMs在多分支网络中通过不同的下采样率获得的各种尺度输入特征上学习卷积滤波器。此外,我们观察到现有的权重初始化方法并不适合多分支网络结构,而这些网络结构在许多任务中最近表现出优于普通网络的性能。因此,我们提供了理论推导,将当前的权重初始化方案扩展到多分支网络结构。我们在两个标准的人体姿态估计基准数据集上验证了我们的方法。我们的方法在这两个基准数据集上均取得了最先进的结果。代码可在https://github.com/bearpaw/PyraNet 获取。