
人間の動作予測、すなわち観測された姿勢シーケンスから将来の体の姿勢を予測する問題は、一般的に再帰型ニューラルネットワーク(RNN)を使用して取り組まれてきました。しかし、先行研究により示されているように、得られたRNNモデルは予測誤差の累積に悩まされており、これが動作予測における望ましくない不連続性を引き起こしています。本論文では、時間的な滑らかさと人間の体節点間の空間的な依存関係を考慮した単純なフィードフォワード深層ネットワークを提案します。この文脈において、我々は伝統的に使用されてきた姿勢空間ではなく、軌道空間で作業を行うことで時間情報を符号化することを提案します。これにより、時間的な依存関係の範囲(または時間畳み込みフィルタサイズ)を手動で定義する必要がなくなります(これは以前の研究で行われていました)。さらに、人間の姿勢の空間的な依存関係は、各体節点間にリンクが形成される汎用グラフとして扱うことで符号化されます(人間の骨格運動木ではなく)。事前に定義されたグラフ構造を使用する代わりに、新しいグラフ畳み込みネットワークを設計し、グラフ接続性を自動的に学習させることで、人間の運動木を超えた長距離依存関係を捉えることが可能になります。我々は提案手法を複数の人間動作予測ベンチマークデータセットで評価しました。これらのデータセットにはHuman3.6M、CMUモーションキャプチャデータセットおよび3DPWが含まれています。実験結果は明確に示しており、提案手法が最先端の性能を達成しており、角度ベースと位置ベースの両方の姿勢表現に適用可能であることを確認しています。コードは以下のURLから入手可能です: https://github.com/wei-mao-2019/LearnTrajDep