3ヶ月前
TSGCNeXt:長期学習可能性を有する効率的な骨格ベース行動認識のための動的・静的マルチグラフ畳み込み
Dongjingdin Liu, Pengpeng Chen, Miao Yao, Yijing Lu, Zijie Cai, Yuxin Tian

要約
骨格ベースの行動認識は、グラフ畳み込みネットワーク(GCN)の発展に伴い、人間の行動認識において顕著な成果を上げている。しかし、近年の研究では、冗長な学習プロセスを伴う複雑な学習メカニズムの構築が進んでおり、長時間系列データに対する処理において長期間にわたる性能のボトルネックが生じている。こうした問題を解決するため、本研究では長時間系列骨格データに対する効率的な学習メカニズムの探索を目的として、時空間グラフConvNeXt(TSGCNeXt)を提案する。まず、シンプルな構造を持つ新たなグラフ学習メカニズムとして、動的・静的分離型マルチグラフ畳み込み(DS-SMG)を提案し、複数の独立したトポロジカルグラフの特徴を効果的に集約するとともに、動的畳み込みにおけるノード情報の無視を回避する。次に、動的グラフ学習における逆伝播計算を最適化するためのグラフ畳み込み学習高速化機構を構築し、学習速度を55.08%向上させた。さらに、TSGCNeXtは、3つの時空間学習モジュールを用いてGCN全体の構造を再設計し、長時間系列特徴の効率的なモデリングを実現した。大規模データセットNTU RGB+D 60および120における既存手法との比較において、単一ストリームネットワークとしてTSGCNeXtは優れた性能を発揮した。さらに、マルチストリーム融合にEMAモデルを導入することで、SOTA(最先端)レベルの性能を達成し、NTU 120のクロスサブジェクトおよびクロスセット設定において、それぞれ90.22%および91.74%の精度を達成した。