3ヶ月前

高品質な人間の運動予測のための次段階へ向けて、段階的により良い初期推定値を生成する手法

Tiezheng Ma, Yongwei Nie, Chengjiang Long, Qing Zhang, Guiqing Li
高品質な人間の運動予測のための次段階へ向けて、段階的により良い初期推定値を生成する手法
要約

本論文では、観測された人体ポーズから将来の人体ポーズを高精度に予測する手法を提示する。本手法の基礎にある観察は、将来のポーズに対する良好な初期推定値が予測精度の向上に極めて有効であるということである。この知見を踏まえ、まず良好な初期推定値を計算する「イニシャル予測ネットワーク」と、その推定値に基づいて目標となる将来ポーズを予測する「正式予測ネットワーク」を備えた二段階予測フレームワークを提案する。さらに重要な点として、このアイデアを拡張し、各段階が次の段階の初期推定値を予測するマルチステージ予測フレームワークを設計した。これにより、さらなる性能向上が達成された。各段階における予測タスクを実現するために、空間的密集型グラフ畳み込みネットワーク(S-DGCN)と時間的密集型グラフ畳み込みネットワーク(T-DGCN)を組み合わせたネットワーク構造を提案する。これらのネットワークを交互に実行することで、全身ポーズ系列全体のグローバルな受容場域において、空間的・時間的特徴を効果的に抽出できる。上記のすべての設計選択が協調的に機能することにより、本手法は従来手法を大幅に上回る性能を達成した。具体的には、Human3.6Mデータセットにおいて6%~7%、CMU-MoCapデータセットで5%~10%、3DPWデータセットで13%~16%の性能向上が確認された。

高品質な人間の運動予測のための次段階へ向けて、段階的により良い初期推定値を生成する手法 | 論文 | HyperAI超神経