
최근 들어, 관측된 자세 시계열을 바탕으로 미래의 신체 자세를 예측하는 인간 운동 예측에 대한 관심이 점차 증가하고 있다. 이 작업은 공간적 및 시간적 관계를 모델링해야 한다는 점에서 복잡하다. 이러한 작업에 가장 널리 사용되는 모델은 자기회귀 모델로서, 순환 신경망(RNN) 또는 그 변종, 그리고 Transformer 네트워크 등이 있다. 그러나 RNN은 기울기 소실 또는 폭주 문제 등의 여러 단점이 있다. 일부 연구자들은 공간 차원에서의 정보 전달 문제를 해결하기 위해 그래프 컨볼루션 네트워크(GCN)와 장기 단기 기억(LSTM) 모델을 결합한 접근법을 시도했다. 그러나 이러한 기존 연구들은 시간적 정보와 공간적 정보를 별도로 다루기 때문에 성능에 한계가 있다. 이러한 문제를 해결하기 위해 본 연구에서는 3차원 인간 자세 예측을 위한 새로운 접근법인 다중 그래프 컨볼루션 네트워크(Multi-Graph Convolution Network, MGCN)를 제안한다. 본 모델은 자세 시계열에 대해 증강된 그래프를 도입함으로써 공간적 및 시간적 정보를 동시에 추출한다. 여러 프레임은 여러 부분을 나타내며, 이들이 하나의 그래프 인스턴스에 통합된다. 또한 본 연구에서는 자연스러운 구조와 시퀀스 인지 주의 메커니즘(sequence-aware attention)이 모델에 미치는 영향도 탐구한다. 대규모 벤치마크 데이터셋인 Human3.6M, AMSS, 3DPW에 대한 실험 평가 결과, MGCN은 기존 최고 성능 모델을 초월하는 자세 예측 성능을 보였다.