
인간 운동 예측, 즉 관찰된 자세 시퀀스를 바탕으로 미래의 몸체 자세를 예측하는 문제는 일반적으로 순환 신경망(RNNs)을 사용하여 해결되었습니다. 그러나 이전 연구에 따르면, 결과적으로 생성된 RNN 모델은 예측 오류 누적 문제로 인해 운동 예측에서 원하지 않는 불연속성을 초래한다는 것이 밝혀졌습니다. 본 논문에서는 시간적 부드러움과 인간 몸체 관절 간의 공간적 의존성을 고려한 단순한 피드포워드 딥 네트워크를 제안합니다. 이와 관련하여 우리는 전통적으로 사용되던 자세 공간이 아닌 궤도 공간에서 작업함으로써 시간 정보를 인코딩하는 방법을 제안합니다. 이는 시간 의존성의 범위(또는 이전 연구에서 수행된 시간 합성곱 필터 크기)를 수동으로 정의할 필요성을 완화시킵니다. 또한, 인간 자세의 공간적 의존성은 모든 관절 쌍 사이의 연결로 형성된 일반 그래프(인간 골격 운동 트리가 아닌)로 처리하여 인코딩됩니다. 사전 정의된 그래프 구조를 사용하지 않고, 우리는 새로운 그래프 합성곱 네트워크를 설계하여 그래프 연결성을 자동으로 학습하도록 하였습니다. 이는 네트워크가 인간 운동 트리 이상의 장거리 의존성을 포착할 수 있게 합니다. 우리는 Human3.6M, CMU 모션 캡처 데이터셋 및 3DPW와 같은 여러 표준 벤치마크 데이터셋을 통해 우리의 접근법을 평가하였습니다. 실험 결과, 제안된 접근법이 최신 기술 수준의 성능을 달성하였으며, 각도 기반 및 위치 기반 자세 표현 모두에 적용 가능함을 명확히 입증하였습니다. 코드는 https://github.com/wei-mao-2019/LearnTrajDep 에서 제공됩니다.