1 个月前

用于人体姿态估计的深度高分辨率表示学习

Ke Sun; Bin Xiao; Dong Liu; Jingdong Wang
用于人体姿态估计的深度高分辨率表示学习
摘要

这是官方的 PyTorch 实现,用于深度高分辨率表示学习的人体姿态估计。在本研究中,我们关注人体姿态估计问题,特别侧重于学习可靠的高分辨率表示。大多数现有方法是从高分辨率到低分辨率网络生成的低分辨率表示中恢复高分辨率表示。而我们提出的网络在整个过程中保持了高分辨率表示。我们从一个高分辨率子网络作为第一阶段开始,逐步添加从高分辨率到低分辨率的子网络以形成更多阶段,并将多分辨率子网络并行连接。我们进行了多次多尺度融合,使得每个从高分辨率到低分辨率的表示都能反复接收来自其他并行表示的信息,从而生成丰富的高分辨率表示。因此,预测的关键点热图在精度上可能更高,在空间上也更加精确。通过在两个基准数据集上的优越姿态估计结果,我们实证了该网络的有效性:COCO 关键点检测数据集和 MPII 人体姿态数据集。代码和模型已在 \url{https://github.com/leoxiaobin/deep-high-resolution-net.pytorch} 公开发布。