
초록
2차원 인간 자세 추정에 대한 합성곱 신경망(CNNs)의 성공이 있었음에도 불구하고, 3차원 인간 자세 추정은 충분히 연구되지 않았습니다. 본 논문에서는 CNNs를 사용하여 엔드투엔드(end-to-end) 학습을 통해 3차원 인간 자세 추정 문제를 다루고자 합니다. 하나의 관절과 다른 관절들 사이의 상대적인 3차원 위치는 CNNs를 통해 학습됩니다. 제안된 방법은 두 가지 혁신적인 아이디어로 CNN의 성능을 향상시킵니다. 첫째, 이미지에서 3차원 자세를 추정하기 위해 2차원 자세 정보를 추가하여 이미지 특징과 2차원 자세 추정 결과를 연결(concatenating)하였습니다. 둘째, 단일 루트 관절(root joint)에 대한 상대 위치 정보 대신 여러 관절에 대한 상대 위치 정보를 결합하면 더 정확한 3차원 자세가 얻어짐을 발견하였습니다. 실험 결과는 제안된 방법이 Human 3.6m 데이터셋에서 최신 기술(state-of-the-art) 방법들과 유사한 성능을 달성함을 보여줍니다.