
초록
구성 모델은 의미 있는 부분과 하위 부분의 계층적 구조로 패턴을 표현한다. 이러한 모델은 신체 부위 간의 고차원적 관계를 특징화할 수 있어, 인간 자세 추정(HPE)에서 발생하는 저수준의 모호성을 해결하는 데 기여한다. 그러나 기존의 구성 모델들은 하위 부분 간의 관계에 대해 현실과 거리가 먼 가정을 하여, 복잡한 구성 패턴을 정확히 표현하는 데 한계가 있다. 게다가 이러한 모델의 고차원 부분들의 상태 공간은 지수적으로 증가할 수 있어 추론과 학습을 크게 복잡하게 만든다. 이러한 문제를 해결하기 위해 본 논문에서는 인간 자세 추정을 위한 새로운 프레임워크인 ‘딥러닝 기반 구성 모델(DLCM)’을 제안한다. 이 모델은 딥 신경망을 활용하여 인간 신체의 구성 특성을 학습하며, 계층적인 구성 아키텍처와 하향식/상향식 추론 단계를 갖춘 네트워크 구조를 구현한다. 또한, 새로운 뼈 기반 부분 표현 방식을 제안한다. 이 표현 방식은 부위의 방향성, 스케일, 형태를 효율적으로 압축하여 표현할 뿐만 아니라, 잠재적으로 큰 상태 공간을 피할 수 있다. 상당히 낮은 계산 복잡도를 유지하면서도, 세 가지 벤치마크 데이터셋에서 최신 기술보다 뛰어난 성능을 달성하였다.