2달 전
3D 인간 자세 추정을 위한 간단하면서도 효과적인 기준선
Julieta Martinez; Rayat Hossain; Javier Romero; James J. Little

초록
딥 컨볼루션 네트워크의 성공 이후, 3D 인간 자세 추정을 위한 최신 방법들은 원시 이미지 픽셀을 입력으로 받아 3D 관절 위치를 예측하는 딥 엔드투엔드 시스템에 초점을 맞추었습니다. 이들의 뛰어난 성능에도 불구하고, 잔여 오류가 제한된 2D 자세(시각적) 이해에서 비롯되었는지, 또는 2D 자세를 3차원 위치로 매핑하는 과정에서 실패했는지를 이해하기 쉽지 않았습니다. 이러한 오류의 원인을 파악하기 위해, 우리는 2D 관절 위치를 입력으로 받아 3D 위치를 예측하는 시스템을 구축하기로 하였습니다. 매우 놀랍게도, 현재 기술로 '리프팅(lifting)' 지상 진실 2D 관절 위치를 3차원 공간으로 옮기는 작업은 매우 낮은 오류율로 해결할 수 있음을 발견하였습니다: 비교적 간단한 딥 피드포워드 네트워크가 가장 우수한 기록된 결과보다 Human3.6M(가장 큰 공개된 3D 자세 추정 벤치마크)에서 약 30% 더 우수한 성능을 보였습니다. 또한, 우리의 시스템을 오프더shelf 최신 2D 검출기의 출력(\ie, 이미지를 입력으로 사용)으로 학습시키면 이 작업을 위해 특별히 엔드투엔드로 학습된 다양한 시스템들을 능가하는 최신 결과를 얻을 수 있었습니다. 우리의 결과는 현대의 딥 3D 인간 자세 추정 시스템의 오류 대부분이 그들의 시각 분석에서 비롯되었음을 나타내며, 이를 통해 3D 인간 자세 추정 분야에서 최신 기술을 더욱 발전시킬 방향을 제시하고 있습니다.