11日前
チャネルごとのトポロジー精製グラフ畳み込みを用いたスケルトンベースのアクション認識
Yuxin Chen, Ziqi Zhang, Chunfeng Yuan, Bing Li, Ying Deng, Weiming Hu

要約
グラフ畳み込みネットワーク(GCN)は、骨格ベースの行動認識において広く用いられ、顕著な成果を上げている。GCNにおいては、グラフのトポロジーが特徴の集約を支配するため、代表的な特徴を抽出する上で中心的な役割を果たす。本研究では、骨格ベースの行動認識を目的として、異なるチャネルにおける関節特徴を効果的に集約できるように、動的に異なるトポロジーを学習する新たな手法である「チャネルごとのトポロジー精緻化グラフ畳み込み(Channel-wise Topology Refinement Graph Convolution: CTR-GC)」を提案する。CTR-GCは、すべてのチャネルに共通するトポロジーを共有事前知識として学習し、各チャネルごとの相関関係を用いてそれを精緻化することで、チャネルごとのトポロジーをモデル化する。本手法は少数の追加パラメータで実現可能であり、チャネルごとのトポロジーをモデル化する難易度を著しく低減する。さらに、グラフ畳み込みを統一的な形式に再定式化することで、CTR-GCがグラフ畳み込みの厳格な制約を緩和し、より強力な表現能力を有することを明らかにした。時間的モデリングモジュールと組み合わせることで、CTR-GCを基盤とする強力なグラフ畳み込みネットワーク「CTR-GCN」を構築した。このCTR-GCNは、NTU RGB+D、NTU RGB+D 120、NW-UCLAの各データセットにおいて、従来の最先端手法を顕著に上回る性能を達成した。