11일 전

단일 프레임 3D 인간 자세 추정을 모노크롬 영상으로 향상시키는 방법

{ Peilin Jiang, Fei Wang, Xuan Wang, Zhi Li}
단일 프레임 3D 인간 자세 추정을 모노크롬 영상으로 향상시키는 방법
초록

정확한 3차원 인간 자세 추정 네트워크를 훈련하기 위한 전제 조건은 풍부하게 레이블링된 대량의 훈련 데이터를 보유하는 것이다. 그러나 수작업으로 풍부하고 정확한 레이블을 확보하는 것은 불가능하진 않지만, 매우 번거롭고 느리다. 본 논문에서는 단일 이미지 기반 3차원 인간 자세 추정 작업의 훈련 데이터셋을 보완하기 위해 단일 카메라 영상을 활용하는 방법을 제안한다. 초기에 소량의 레이블을 사용해 기준 모델을 훈련한 후, 얻어진 모델이 생성한 신뢰할 수 있는 추정 결과를 고정함으로써, 3차원 경로 보완 문제를 해결하는 방식으로 전체 영상에 걸쳐 자동으로 레이블을 수집한다. 이후 수집된 레이블을 이용해 기준 모델을 추가로 훈련함으로써 새로운 자세를 학습하게 한다. 제안한 방법은 널리 채택된 Human3.6M 및 MPI-INF-3DHP 데이터셋에서 평가되었다. 실험 결과에 따르면, 소량의 초기 레이블만으로도 모델이 레이블이 없는 단일 카메라 영상에서 새로운 자세를 학습할 수 있으며, 기준 모델의 정확도를 약 10% 향상시켰다. 기존의 접근 방식들과 비교하여 본 방법은 다중 시점 영상이나 명시적인 2차원 키포인트 레이블에 의존하지 않는다.

단일 프레임 3D 인간 자세 추정을 모노크롬 영상으로 향상시키는 방법 | 최신 연구 논문 | HyperAI초신경