4달 전
깊은 신경망을 이용한 3D 인간 자세의 구조화된 예측
Bugra Tekin; Isinsu Katircioglu; Mathieu Salzmann; Vincent Lepetit; Pascal Fua

초록
최근의 단일 카메라 3차원 자세 추정 접근 방식 대부분은 딥 러닝에 의존하고 있습니다. 이들 방법은 이미지에서 3차원 자세로 직접 회귀를 수행하는 컨볼루션 신경망(CNN)을 훈련시키거나, 추론 시 높은 계산 비용이 발생하는 최대 마진 구조 학습 프레임워크를 통해 인간 관절 간의 의존성을 모델링합니다. 전자는 인간 관절 간의 상호 작용을 무시하고, 후자는 계산 비용이 매우 높습니다.본 논문에서는 단일 카메라 이미지에서 3차원 인간 자세를 구조적으로 예측하기 위한 딥 러닝 회귀 아키텍처를 소개합니다. 이 아키텍처는 과완전 오토인코더(overcomplete auto-encoder)를 사용하여 고차원 잠재 자세 표현을 학습하고, 관절 간 의존성을 고려합니다. 실험 결과, 우리의 접근 방식이 구조 보존과 예측 정확도 측면에서 기존 최신 방법들을 능가함을 입증하였습니다.