
摘要
我们提出了一种名为BAPose的新颖自底向上方法,该方法在多人姿态估计方面取得了最先进的成果。我们的端到端可训练框架利用了分离的多尺度瀑布架构,并结合了自适应卷积,以在拥挤且存在遮挡的场景中更精确地推断关键点。通过BAPose中的分离瀑布模块获得的多尺度表示,在级联架构中充分利用了逐步过滤的高效性,同时保持了与空间金字塔配置相当的多尺度视场。我们在具有挑战性的COCO和CrowdPose数据集上的实验结果表明,BAPose是一种高效且鲁棒的多人姿态估计框架,在准确性方面显著超越了现有最先进方法。