11일 전
야외 환경에서의 3차원 인간 자세 예측을 위한 일반적인 확산 기반 접근법
Saeed Saadatnejad, Ali Rasekh, Mohammadreza Mofayezi, Yasamin Medghalchi, Sara Rajabzadeh, Taylor Mordan, Alexandre Alahi

초록
실세계 환경에서 3차원 인간 자세를 예측하는 작업, 즉 인간 자세 예측(Human Pose Forecasting)은 정확한 3D 자세 추정의 오류와 가림 현상 등으로 인해 불확실한 입력 데이터에 노출되는 것은 불가피하다. 이러한 문제를 해결하기 위해, 노이즈가 있는 관측 데이터를 기반으로 예측이 가능한 확산 기반( diffusion-based) 방법을 제안한다. 본 연구에서는 관측값과 예측값을 모두 결합된 시계열(sequence)로 간주하고, 관측 단계나 예측 구간 내에서 누락된 요소를 노이즈로 간주하여, 조건부 확산 모델을 이용해 이를 복원하는 방식으로 예측 문제를 노이즈 제거 문제로 재정의한다. 장기 예측 구간을 효과적으로 다루기 위해, 시간적 계단식 확산 모델(temporal cascaded diffusion model)을 제안한다. 제안한 방법은 네 가지 공개된 데이터셋(Human3.6M, HumanEva-I, AMASS, 3DPW)에서 기존 최고 수준의 기법들을 능가함을 입증하였다. 또한, 본 프레임워크가 일반화된 구조를 갖추고 있음을 보여주며, 3D 자세 예측 모델의 입력을 보정하는 전처리 단계와 출력을 개선하는 후처리 단계로 활용 가능함을 보였다. 코드는 온라인으로 공개되어 있으며, 다음 링크에서 확인할 수 있다: \url{https://github.com/vita-epfl/DePOSit}.