4달 전
단일 카메라를 이용한 계단식 심층 3D 인간 자세 추정과 진화적 훈련 데이터
Shichao Li; Lei Ke; Kevin Pratama; Yu-Wing Tai; Chi-Keung Tang; Kwang-Ting Cheng

초록
단일 카메라를 이용한 3D 인간 자세 추정에서 엔드투엔드 딥 리프레젠테이션 학습은 뛰어난 정확도를 달성하였으나, 제한적이고 고정된 훈련 데이터로는 미처 본 적 없는 자세에 대해 모델이 실패할 수 있다. 이 논문에서는 다음과 같은 새로운 데이터 증강 방법을 제안한다: (1) 2D-3D 네트워크를 훈련시키기 위한 대량의 훈련 데이터(800만 개 이상의 유효한 3D 인간 자세와 해당 2D 투영) 생성에 확장성이 있으며, (2) 데이터셋 편향을 효과적으로 줄일 수 있다. 우리의 방법은 계층적인 인간 표현과 사전 지식에서 영감을 받은 직관에 기반하여 제한적인 데이터셋을 진화시켜 미처 본 적 없는 3D 인간 골격을 합성한다. 광범위한 실험 결과, 우리의 접근 방식이 가장 큰 공개 벤치마크에서 최고 수준의 정확도를 달성하는 데 그치지 않고, 미처 본 적 없는 자세와 드문 자세에도 상당히 더 잘 일반화됨을 보여준다. 코드,事前訓練된 모델 및 도구는 이 HTTPS URL에서 제공된다.注:在最后一句中,“事前训练”是“pre-trained”的直译,但通常在韩文中会使用“미리 학습된”来表示这个意思。因此,建议修改为:코드, 미리 학습된 모델 및 도구는 이 HTTPS URL에서 제공된다.