15일 전
MotionMixer: MLP 기반 3D 인간 신체 자세 예측
Arij Bouazizi, Adrian Holzbock, Ulrich Kressel, Klaus Dietmayer, Vasileios Belagiannis

초록
본 연구에서는 다층 퍼셉트론(Multi-layer Perceptrons, MLPs)만을 기반으로 하는 효율적인 3D 인간 신체 자세 예측 모델인 MotionMixer를 제안한다. MotionMixer는 공간-시계열 3D 신체 자세 간의 종속성을 순차적으로 혼합함으로써 학습한다. 입력으로 주어진 3D 신체 자세 시계열을 바탕으로, 공간 MLP는 신체 관절 간의 세밀한 공간적 종속성을 추출하고, 시간에 따른 관절 간 상호작용은 시계열 MLP를 통해 모델링한다. 이후 공간-시계열 혼합 특징은 최종적으로 집계되고 디코딩되어 미래의 운동을 예측한다. 자세 시계열 내 각 시간 단계의 영향력을 보정하기 위해, 스queeze-and-excitation(SE) 블록을 활용한다. 제안한 방법은 Human3.6M, AMASS, 3DPW 데이터셋을 대상으로 표준 평가 프로토콜을 사용하여 평가되었으며, 모든 평가에서 최신 기술(SOTA) 수준의 성능을 달성하면서도 파라미터 수가 적은 소형 모델을 구현하였다. 코드는 다음 링크에서 공개되어 있다: https://github.com/MotionMLP/MotionMixer