
폐색(occlusion)은 모노클라 뮬티-퍼슨 3D 인간 자세 추정에서 큰 위협을 초래합니다. 이는 폐색물의 형태, 외관, 위치에 대한 큰 변동성 때문입니다. 기존 방법들은 자세 사전 정보/제약(pose priors/constraints), 데이터 증강(data augmentation), 또는 암시적 추론(implicit reasoning)을 통해 폐색을 처리하려고 하지만, 여전히 미처 보지 못한 자세나 폐색 상황에는 일반화하지 못하며 여러 사람이 동시에 존재할 때 큰 오류를 범할 수 있습니다. 인간이 가시적인 힌트로부터 폐색된 관절을 추론하는 뛰어난 능력에 영감을 받아, 우리는 이를 명시적으로 모델링하는 방법을 개발하여 폐색 유무와 상관없이 바텀업(buttom-up) 방식의 다중 인물 인간 자세 추정 성능을 크게 향상시키는 데 성공했습니다. 먼저, 이 작업을 두 가지 하위 작업으로 나누었습니다: 가시적 키포인트 검출과 폐색된 키포인트 추론이며, 후자를 해결하기 위해 깊게 감독된 인코더 디스틸레이션(Deeply Supervised Encoder Distillation, DSED) 네트워크를 제안하였습니다. 우리의 모델을 학습시키기 위해, 기존 데이터셋에서 의사 폐색 라벨(pseudo occlusion labels)을 생성하는 스켈레톤 안내형 인간 형태 적합(Skeleton-guided human Shape Fitting, SSF) 접근법을 제안하였습니다. 이로써 명시적인 폐색 추론이 가능해졌습니다. 실험 결과, 폐색으로부터 명시적으로 학습하는 것이 인간 자세 추정에 긍정적인 영향을 미치는 것으로 나타났습니다. 또한 가시적 관절의 특징 수준 정보를 활용함으로써 우리는 폐색된 관절에 대해 더욱 정확하게 추론할 수 있었습니다. 우리의 방법은 여러 벤치마크에서 최신의 탑다운(top-down) 및 바텀업(buttom-up) 방법들을 모두 능가하였습니다.