
要約
姿勢予測とは、過去の姿勢のウィンドウが与えられた状態で将来の姿勢を予測することである。本論文では、3次元関節座標シーケンスを使用して姿勢を予測する新しい問題を提案する。伝統的なモーションキャプチャ(Mocap)フレームに基づく姿勢予測とは異なり、この問題はデータを取得するために使用されるセンサが単純なため、実際の応用に便利である。また、この新しい問題に対処するために、PISEP^2(Pseudo Image Sequence Evolution based 3D Pose Prediction)という新しいフレームワークを提示する。具体的には、関節座標シーケンスを画像シーケンスに変換することで骨格表現を提案し、異なる関節間の相関関係をモデル化できるようにしている。この画像ベースの骨格表現を使用することで、姿勢予測を画像シーケンスの進化としてモデル化する。さらに、非再帰的な方法でデコーダーを分離することにより、一回のステップで全ての将来の姿勢を予測する新しい推論ネットワークを提案する。再帰的なシーケンス・ツー・シーケンスモデルと比較すると、計算効率が向上し、誤差蓄積も大幅に回避できる。G3DやFNTUなどの2つのベンチマークデータセットに対して広範な実験を行った結果、提案手法は両方のデータセットで最先端の性能を達成しており、その有効性が示されている。