불확실성 인식 적응을 위한 자기 지도 3D 인간 자세 추정

단일 카메라를 이용한 3D 인간 자세 추정의 발전은 대규모 2D/3D 자세 주석이 필요한 감독 학습 기술에 의해 주도되고 있습니다. 이러한 방법들은 익숙하지 않은 분포 외 데이터(out-of-distribution data)를 제거할 수 있는 기능이 없을 때 종종 예측이 불안정하게 작동합니다. 이를 해결하기 위해, 우리는 3D 인간 자세 학습을 비감독 도메인 적응 문제로 재구성하였습니다. 우리는 MRP-Net을 소개하는데, 이는 두 가지 다양한 설정을 따르는 두 개의 출력 헤드를 갖춘 공통의 딥 네트워크 백본(common deep network backbone)으로 구성됩니다: a) 모델 없는 관절 위치 추정(model-free joint localization)과 b) 모델 기반 매개변수 회귀(model-based parametric regression). 이러한 설계는 포즈와 관절 수준에서 예측 불확실성을 정량화할 수 있는 적합한 측정치를 도출할 수 있게 합니다. 라벨된 합성 샘플만을 사용하여 감독하는 동안, 적응 과정은 라벨이 없는 대상 이미지의 불확실성을 최소화하면서 극단적인 분포 외 데이터셋(배경)의 불확실성을 최대화하는 것을 목표로 합니다. 합성-현실 3D 자세 적응뿐만 아니라, 관절 불확실성은 가림(occlusion)과 절단(truncation) 상황에서도 야외 이미지(in-the-wild images)에서 작업을 확장할 수 있게 합니다. 우리는 제안된 접근법에 대한 포괄적인 평가를 제시하고, 벤치마크 데이터셋에서 최신 성능(state-of-the-art performance)을 보여줍니다.