
정확한 3차원 인간 자세 추정기의 훈련에는 많은 양의 3차원 기준 데이터가 필요하지만, 이는 수집하기에 비용이 많이 듭니다. 3차원 데이터 부족으로 인해 다양한 약한 지도 또는 자기 지도 자세 추정 방법들이 제안되었습니다. 그러나 이러한 방법들은 2차원 기준 자세 외에도 추가적인 지도 형태(e.g., 짝을 이루지 않은 3차원 기준 데이터, 라벨의 작은 부분 집합)나 다중 시점 설정에서 카메라 매개변수를 요구합니다. 이러한 문제들을 해결하기 위해, 우리는 어떠한 3차원 기준 데이터나 카메라 외부 매개변수도 필요로 하지 않는 3차원 인간 자세 추정을 위한 자기 지도 학습 방법인 EpipolarPose를 제시합니다. 훈련 과정에서 EpipolarPose는 다중 시점 이미지들로부터 2차원 자세를 추정하고, 그 다음에 쌍대선(또는 기본) 기하학을 활용하여 3차원 자세와 카메라 기하학을 획득합니다. 이를 통해 획득된 정보들은 이후 3차원 자세 추정기를 훈련시키는데 사용됩니다. 우리는 표준 벤치마크 데이터셋인 Human3.6M과 MPI-INF-3DHP에서 약한/자기 지도 방법들 중 새로운 최고 수준의 성능을 달성함으로써 우리의 접근 방식의 효과성을 입증하였습니다. 또한, 우리는 자세 구조 점수(Pose Structure Score, PSS)라는 새로운 성능 측정 방법을 제안하는데, 이는 스케일 불변(scale invariant), 구조 인식(structure aware) 측정법으로서, 추정된 자세가 실제 기준값에 대해 구조적으로 타당한지를 평가하는 데 사용됩니다. 코드와 사전 훈련된 모델은 https://github.com/mkocabas/EpipolarPose에서 제공됩니다.