2달 전

다중 가설 3D 인간 자세 추정 지표는 오차 보정된 분포를 선호한다.

Pierzchlewicz, Paweł A. ; Cotton, R. James ; Bashiri, Mohammad ; Sinz, Fabian H.
다중 가설 3D 인간 자세 추정 지표는 오차 보정된 분포를 선호한다.
초록

깊이의 모호성과 가림 현상으로 인해 2D 자세를 3D로 변환하는 것은 매우 불안정한 문제입니다. 가능한 자세들의 잘 보정된 분포는 이러한 모호성을 명시적으로 나타내고, 후속 작업을 위해 결과적인 불확실성을 유지할 수 있습니다. 본 연구에서는 이전 시도들이 여러 가설 생성을 통해 이러한 모호성을 고려하였음에도 불구하고, 잘못 보정된 분포를 생성한다는 것을 보여주었습니다. 우리는 잘못된 보정이 minMPJPE와 같은 샘플 기반 지표의 사용에 기인할 수 있음을 확인하였습니다. 일련의 시뮬레이션에서, minMPJPE를 최소화하는 것이 일반적으로 수행되지만, 올바른 평균 예측으로 수렴해야 함에도 불구하고 불확실성을 올바르게 포착하지 못하여 잘못 보정된 분포가 발생함을 보였습니다. 이 문제를 완화하기 위해, 우리는 조건부 그래프 정규화 흐름(Conditional Graph Normalizing Flow, cGNFs)이라는 정확하고 잘 보정된 모델을 제안합니다. 우리의 모델은 단일 cGNF가 동일한 모델 내에서 조건부 밀도와 주변 밀도를 모두 추정할 수 있도록 구조화되어 있어, 사실상 제로샷 밀도 추정 문제를 해결합니다. 우리는 Human~3.6M 데이터셋에서 cGNF를 평가하여, cGNF가 전체적인 minMPJPE 측면에서 최신 기술에 근접하면서도 잘 보정된 분포 추정을 제공함을 보였습니다. 또한, cGNF는 가림된 관절에서도 이전 방법들을 능가하며, 여전히 잘 보정되어 있다는 점을 입증하였습니다.