11日前
階層的分解されたグラフ畳み込みネットワークを用いたスケルトンベースのアクション認識
Jungho Lee, Minhyeok Lee, Dogyoon Lee, Sangyoun Lee

要約
骨格に基づく行動認識において、グラフ畳み込みネットワーク(GCN)は最も広く用いられている手法であり、優れた性能を達成している。このタスクにおいて、意味的に有意義なエッジを持つ隣接行列を生成することは特に重要であるが、このようなエッジを抽出することは困難な課題である。これを解決するために、本研究では階層的分解型グラフ畳み込みネットワーク(HD-GCN)アーキテクチャと、新たな階層的分解型グラフ(HD-Graph)を提案する。提案手法であるHD-GCNは、各関節ノードを複数の集合に階層的に分解することで、主な構造的近接エッジおよび遠隔エッジを効果的に抽出し、それらを人間の骨格の同一意味空間内に含むHD-Graphを構築する。さらに、HD-Graphの主要な階層的エッジ集合を強調するため、注意機構を導入した階層的集約モジュール(A-HAモジュール)を導入する。また、運動ストリームを一切使用せずに、関節ストリームとボーンストリームのみを用いる新たな六方向アンサンブル手法を適用している。提案モデルは、4つの大規模かつ代表的なデータセットにおいて評価され、最先端の性能を達成した。最後に、多数の比較実験を通じて、本モデルの有効性を実証した。