11日前
MotionMixer:MLPを用いた3D人体ポーズ予測
Arij Bouazizi, Adrian Holzbock, Ulrich Kressel, Klaus Dietmayer, Vasileios Belagiannis

要約
本研究では、マルチレイヤーパーセプトロン(MLP)のみを用いて構築された、効率的な3次元人体ポーズ予測モデル「MotionMixer」を提案する。MotionMixerは、空間的・時系列的特徴を順次混合することで、3次元人体ポーズの空間時系列依存関係を学習する。与えられた3次元人体ポーズの連続シーケンスに対して、空間MLPが関節間の詳細な空間的依存関係を抽出し、その後、時系列MLPにより関節間の時間的相互作用をモデル化する。得られた空間時系列混合特徴は最終的に集約・デコードされ、未来の動きを予測する。また、ポーズシーケンスにおける各時刻の影響度を適切に調整するため、squeeze-and-excitation(SE)ブロックを導入している。本手法は、Human3.6M、AMASS、3DPWの3つのデータセットにおいて、標準的な評価プロトコルに基づいて評価された。すべての評価において、パラメータ数が少ないモデルながらも、最先端の性能を達成することを示した。本研究のコードは、以下のURLから公開されている:https://github.com/MotionMLP/MotionMixer