
인간 자세 추정 방법은 단독으로 존재하는 사람에 대해서는 잘 작동하지만, 다수의 사람들이 가까이 있는 상황에서는 어려움을 겪습니다. 이전 연구에서는 감지된 경계 상자(bounding boxes)나 키포인트(keypoints)를 통해 자세 추정을 조건부로 수행하여 이 문제를 해결하려고 하였으나, 인스턴스 마스크(instance masks)를 간과하였습니다. 우리는 경계 상자, 인스턴스 마스크, 그리고 자세 사이의 상호 일관성을 반복적으로 강제하는 방법을 제안합니다. 소개된 경계상자-마스크-자세(BBox-Mask-Pose, BMP) 방법은 세 가지 전문 모델을 사용하여 폐루프에서 각 모델의 출력을 개선합니다. 모든 모델은 서로 다른 조건부로 적응되어 있어, 다중 인물 장면에서의鲁棒性(robustness)을 향상시킵니다. 새로운 마스크 조건부 자세 추정 모델인 MaskPose는 OCHuman 데이터셋에서 상위 하향(top-down) 접근 방식 중 가장 우수한 성능을 보입니다. BBox-Mask-Pose는 OCHuman 데이터셋에서 검출, 인스턴스 분할, 그리고 자세 추정의 세 가지 작업 모두에서 최신 기술(SOTA) 수준의 성능을 달성하였으며, COCO 자세 추정에서도 최신 기술(SOTA) 수준의 성능을 보입니다. 특히 큰 인스턴스 중첩이 있는 장면에서는 베이스라인 검출기보다 39% 더 높은 검출 성능을 보여줍니다. 작은 전문 모델과 빠른 실행 시간으로 BMP는 대형 인간 중심 기초 모델에 대한 효과적인 대안입니다. 코드와 모델은 https://MiraPurkrabek.github.io/BBox-Mask-Pose 에서 제공됩니다.注:在翻译“鲁棒性”时,我使用了“鲁棒性(robustness)”的形式,因为这个词在韩语中并不常见。如果需要完全使用韩语表达,可以将其替换为“내성”或“강건성”。