17日前

骨格に基づく行動認識のための階層的再帰型ニューラルネットワーク

{Liang Wang, Yong Du, Wei Wang}
要約

人体の行動は骨格関節の軌跡として表現できる。従来の手法では、手作業で設計された特徴量を用いて骨格の空間構造および時間的動態をモデル化し、設計された分類器によって行動を認識していた。本研究では、再帰型ニューラルネットワーク(RNN)が時間系列の長期的文脈情報を効果的にモデル化できることに着目し、骨格に基づく行動認識を目的としたエンドツーエンド型階層的RNNを提案する。全体の骨格を入力とするのではなく、人体の解剖学的構造に基づいて骨格を五つの部位に分割し、それぞれを別々のサブネットに供給する。層数が増加するに従い、サブネットによって抽出された表現が階層的に統合され、上位層の入力として用いられる。最終的な骨格時系列表現は単層パーセプトロンに供給され、その時間的に累積された出力が最終的な分類結果となる。提案手法の有効性を確認するため、本モデルを元に導出された他の五つの深層RNNアーキテクチャと比較し、また、公開されている三つのデータセットにおいて他の複数の手法と比較した。実験結果から、本モデルが高い計算効率を維持しつつ、最先端の性能を達成していることが示された。

骨格に基づく行動認識のための階層的再帰型ニューラルネットワーク | 最新論文 | HyperAI超神経