3ヶ月前
ニューラルサーチを用いた骨格ベース人間行動認識のための学習グラフ畳み込みネットワーク
Wei Peng, Xiaopeng Hong, Haoyu Chen, Guoying Zhao

要約
骨格データからの人間の行動認識は、グラフ畳み込みネットワーク(GCN)の発展により、非ユークリッド構造データを効果的にモデル化できるという強力な能力から、近年注目を集めている。しかし、多くの既存のGCN手法では、ネットワーク全体を通じて固定された事前定義されたグラフを用いるため、関節間の隠れた相関関係を捉え損なうことがある。また、主流のスペクトル型GCNは一次近似(one-order hop)によって近似されるため、高次の接続関係が十分に反映されないという問題がある。このような課題に対処するため、より優れたGCNアーキテクチャの探索が急務となっている。本研究では、神経アーキテクチャ探索(NAS)に着目し、骨格ベースの行動認識を目的とした初めての自動設計GCNを提案する。具体的には、ノード間の空間時間的相関を十分に分析した上で、複数の動的グラフモジュールを探索空間に導入し、探索空間を拡張する。さらに、複数ホップ(multiple-hop)モジュールを導入することで、一次近似による表現能力の制約を克服することを目的とする。また、効率的なサンプリングとメモリ使用を実現する進化戦略を提案し、本タスクに最適なアーキテクチャの探索を実現している。得られたアーキテクチャは、高次の近似の有効性および時間的相互作用を考慮した動的グラフモデリング機構の優位性を実証しており、これまでほとんど議論されてこなかった重要な要素である。提案モデルの性能評価として、大規模な2つのデータセット上で広範な実験を実施した結果、本モデルは最先端の性能を達成した。