13日前
MSR-GCN:人間の運動予測のためのマルチスケール残差グラフ畳み込みネットワーク
Lingwei Dang, Yongwei Nie, Chengjiang Long, Qing Zhang, Guiqing Li

要約
人体の運動予測は、将来のポーズの確率性および非周期性のため、非常に困難な課題である。近年、グラフ畳み込みネットワーク(GCN)が、ポーズの関節間の動的関係を効果的に学習できることを示しており、ポーズ予測に有効であることが明らかになった。一方で、人体のポーズは再帰的に抽象化することで、複数スケールにおけるポーズ集合を獲得できる。抽象化レベルが高くなるにつれて、ポーズの運動はより安定化するため、これもポーズ予測に有利に働く。本論文では、エンド・ツー・エンドのアプローチにより人体ポーズ予測を実現するため、新たなマルチスケールリジッドグラフ畳み込みネットワーク(MSR-GCN)を提案する。本手法では、GCNを用いて細かいスケールから粗いスケールへ、さらに粗いスケールから細かいスケールへと特徴を抽出する。各スケールで抽出された特徴はその後統合され、入力ポーズと目標ポーズの差分(リジッド)を復元する。また、すべての予測されたポーズに対して中間監視(intermediate supervision)を適用することで、ネットワークがより代表的な特徴を学習するよう促進する。提案手法は、標準的なベンチマークデータセットであるHuman3.6MとCMU Mocapの2つのデータセット上で評価された。実験結果から、本手法が最先端の手法を上回ることを示した。コードおよび事前学習済みモデルは、https://github.com/Droliven/MSRGCN で公開されている。