
다중 인물 자세 추정은 어려운 문제입니다. 기존 방법들은 대부분 제안 생성과 자세를 해당 인물에 할당하는 두 단계로 구성되어 있습니다. 그러나 이러한 두 단계 방법들은 일반적으로 효율성이 낮습니다. 본 연구에서는 다중 인물 자세 추정의 파이프라인을 간소화하고 효율성을 높이기 위해 첫 번째 단일 단계 모델, Single-stage multi-person Pose Machine (SPM)을 제시합니다. 이를 달성하기 위해, 우리는 새로운 Structured Pose Representation (SPR)을 제안하여 인물 인스턴스와 신체 관절 위치 표현을 통합합니다. SPR을 기반으로, SPM 모델은 여러 인물의 구조화된 자세를 단일 단계에서 직접 예측할 수 있으며, 이로써 더 간결한 파이프라인과 두 단계 방법에 비해 매력적인 효율성 우위를 제공합니다. 특히, SPR은 다른 인물 인스턴스를 나타내는 루트 관절을 도입하며, 인간 신체 관절 위치는 루트에 대한 변위로 인코딩됩니다. 일부 관절의 장거리 변위를 더 잘 예측하기 위해, SPR은 계층적 표현으로 확장됩니다. SPR을 기반으로, SPM은 CNNs을 통해 동시에 루트 관절(인스턴스 위치)과 신체 관절 변위를 예측함으로써 다중 인물 자세 추정을 효율적으로 수행할 수 있습니다. 또한 SPM의 일반성을 입증하기 위해, 우리는 이를 다중 인물 3D 자세 추정에도 적용하였습니다. MPII, 확장된 PASCAL-Person-Part, MSCOCO 및 CMU Panoptic 벤치마크에서 수행한 포괄적인 실험들은 SPM이 다중 인물 2D/3D 자세 추정에서 최신 수준의 효율성을 보여주며, 뛰어난 정확도를 함께 제공한다는 것을 명확히 입증하였습니다.