7일 전

HPRNet: 전체 신체 인간 자세 추정을 위한 계층적 포인트 회귀

Nermin Samet, Emre Akbas
HPRNet: 전체 신체 인간 자세 추정을 위한 계층적 포인트 회귀
초록

이 논문에서는 전신 포즈 추정을 위한 새로운 하향식 단계형 방법을 제안한다. 이를 '계층적 포인트 회귀(Hierarchical Point Regression)'라 명명하며, 약어로 HPRNet이라 한다. 기존의 신체 포즈 추정에서는 인간 신체의 약 17개 주요 관절 위치를 추정한다. 반면, 전신 포즈 추정은 얼굴(68개 점), 손(각각 21개 점), 발(각각 3개 점) 등보다 세밀한 키포인트 위치까지 추정하므로, 서로 다른 신체 부위 간의 척도 차이 문제(scale variance problem)가 발생한다. 이 척도 차이 문제를 해결하기 위해, 우리는 신체 부위별로 계층적 포인트 표현을 구축하고, 이를 동시에 회귀한다. 각 부위(예: 얼굴) 내의 세밀한 키포인트들의 상대적 위치는 해당 부위의 중심을 기준으로 회귀되며, 이 중심점 자체는 사람의 중심에 대해 추정된다. 또한 기존의 이단계식 방법들과 달리, 본 방법은 이미지 내 인원 수에 관계없이 일정한 시간 내에 전신 포즈를 예측할 수 있다. COCO WholeBody 데이터셋에서 HPRNet은 모든 전신 부위(신체, 발, 얼굴, 손)의 키포인트 탐지 성능에서 기존의 모든 하향식 방법들을 크게 상회하며, 특히 얼굴 키포인트 탐지(75.4 AP)와 손 키포인트 탐지(50.4 AP)에서 최신 기술 수준(SOTA)의 성능을 달성하였다. 코드와 모델은 \url{https://github.com/nerminsamet/HPRNet}에서 제공된다.