17日前

Skeleton-Graph:Deep Spatio-Temporal Graph CNNを用いた2D観測からの長期3D運動予測

Abduallah Mohamed, Huancheng Chen, Zhangyang Wang, Christian Claudel
Skeleton-Graph:Deep Spatio-Temporal Graph CNNを用いた2D観測からの長期3D運動予測
要約

自律走行、拡張現実(AR)、仮想現実(VR)などの多くの応用分野において、3次元人体ポーズの高精度な予測が求められている。近年、観測された2次元ポーズから3次元ポーズを予測するという新しい課題が、この分野に提示された。本研究では、2次元ポーズから一回の順伝播で将来の3次元骨格ポーズを予測する深層時空間グラフCNNモデル「Skeleton-Graph」を提案する。従来の手法とは異なり、Skeleton-Graphは骨格関節間の相互作用に着目し、関節の空間的配置を活用してモデル化を行う。この目的を達成するために、問題をグラフ構造として定式化し、適切なグラフ隣接カーネルを学習する。この設計により、長期間にわたる予測において発散を生じることなく、将来の3次元ポーズを安定して予測できる。また、長期間にわたる予測の発散を測定するための新しい評価指標を導入した。実験結果から、GTA-IMおよびPROXデータセットにおいて、従来手法と比較して、FDE(Final Displacement Error)で少なくとも27%、ADE(Average Displacement Error)で4%の改善が得られた。さらに、長期間の運動予測において、GTA-IMおよびPROXデータセットでそれぞれ88%および93%の発散低減が確認された。実装コードは以下のURLで公開されている:https://github.com/abduallahmohamed/Skeleton-Graph.git