
摘要
我们提出了一种高效检测图像中多人二维姿态的方法。该方法采用一种非参数表示,即我们称之为“部位亲和场”(Part Affinity Fields, PAFs),用于学习图像中身体部位与个体之间的关联。该架构编码了全局上下文信息,使得自下而上的贪婪解析步骤能够在保持高精度的同时实现实时性能,无论图像中的人数多少。该架构设计为通过同一顺序预测过程的两个分支联合学习部位位置及其关联。我们的方法在首届COCO 2016关键点挑战赛中获得第一名,并且在MPII多人基准测试中,无论是性能还是效率都显著超过了之前最先进的结果。