
摘要
现有的多人姿态估计方法大致可分为两阶段方法(自顶向下和自底向上)以及单阶段方法。两阶段方法要么因依赖额外的人体检测器而导致计算冗余,要么在预测出所有无实例区分的关键点后,通过启发式策略对关键点进行分组。近年来提出的单阶段方法虽无需上述两个额外阶段,但其性能仍低于最新的自底向上方法。本文提出一种新型的单阶段多人姿态回归方法,称为SMPR(Single-Stage Multi-Person Pose Regression)。该方法遵循密集预测范式,从每个空间位置直接预测具有实例感知能力的关键点。除特征聚合外,本文还提出了更优的正样本姿态假设定义策略,以提升训练效果,这些策略在密集姿态估计中发挥了关键作用。此外,网络还学习所估计姿态的置信度分数,通过姿态评分策略在非极大值抑制(NMS)过程中优先保留高质量姿态,进一步提升了姿态估计性能。实验结果表明,所提方法不仅显著优于现有单阶段方法,且在COCO test-dev姿态评估基准上达到了70.2 AP和77.5 AP75的性能,与最新的自底向上方法相当。相关代码已开源,地址为:https://github.com/cmdi-dlut/SMPR。