
초록
단일 카메라를 이용한 자연 환경에서의 3D 인간 자세 추정에 대한 주요 과제는 정확한 3D 자세로 주석된 제약 없는 이미지를 포함하는 훈련 데이터의 획득입니다. 본 논문에서는 이 과제를 해결하기 위해 3D 주석이 필요하지 않고, 자연 환경에서 쉽게 획득할 수 있는 비라벨 다중 시점 데이터로부터 3D 자세를 추정하도록 학습하는 약간 지도된 접근법을 제안합니다. 우리는 다중 시점 일관성을 활용하여 약간 지도된 훈련을 가능하게 하는 새로운 엔드투엔드 학습 프레임워크를 제안합니다. 다중 시점 일관성이 변형된 해법에 취약하기 때문에, 우리는 2.5D 자세 표현을 채택하고, 훈련된 모델의 예측이 모든 카메라 시점에서 일관적이고 타당할 때만 최소화될 수 있는 새로운 목적 함수를 제안합니다. 우리는 제안한 접근법을 두 개의 대규모 데이터셋(Human3.6M 및 MPII-INF-3DHP)에서 평가하였으며, 반-/약간 지도된 방법들 중 최고 성능을 달성하였습니다.