
초록
본 논문에서는 2D에서 3D 인간 자세 추정 작업을 위한 새로운 그래프 컨볼루션 네트워크 아키텍처인 Graph Stacked Hourglass Networks를 제안한다. 제안하는 아키텍처는 반복적인 인코더-디코더 구조로 구성되며, 인간 골격 표현의 세 가지 서로 다른 스케일에서 그래프 구조화된 특징을 처리한다. 이 다중 스케일 아키텍처는 국소적 및 전역적 특징 표현을 학습할 수 있도록 하여 3D 인간 자세 추정에 있어 핵심적인 역할을 한다. 또한, 다양한 깊이의 중간 특징을 활용한 다수준 특징 학습 방식을 도입하여, 다중 스케일 및 다중 수준 특징 표현을 활용함으로써 얻어지는 성능 향상을 보여준다. 제안된 방법의 타당성을 검증하기 위해 광범위한 실험이 수행되었으며, 실험 결과 제안 모델이 최신 기술(SOTA)을 초월함을 입증하였다.