12日前

InfoGCN:人間の骨格に基づく行動認識のための表現学習

{Karthik Ramani, QiXing Huang, Sang Wan Lee, Seunggeun Chi, Myoung Hoon Ha, Hyung-gun Chi}
InfoGCN:人間の骨格に基づく行動認識のための表現学習
要約

ヒューマンスケルトンに基づく行動認識は、身体的制約と意図の間の複雑な関係を扱えるため、人間行動の複雑性を理解する上で貴重な手段を提供する。既存の研究ではスケルトンの符号化に焦点が当てられているが、その情報を人間行動の潜在表現に統合する点にはまだ十分な注目が寄せられていない。本研究では、新たな学習目的関数と符号化手法を組み合わせた行動認識のための学習フレームワーク「InfoGCN」を提案する。まず、情報ボトルネックに基づく学習目的関数を設計し、情報量が多くかつコンパクトな潜在表現を学習するようにモデルを誘導する。さらに、行動分類に有用な判別的情報を提供するために、文脈依存的な人間行動の内在的トポロジーを捉えるアテンションベースのグラフ畳み込みを導入する。また、関節間の相対位置を用いたマルチモーダルなスケルトン表現を提示することで、関節に対して補完的な空間情報を提供する。提案手法は、NTU RGB+D 60のクロスサブジェクト分割において93.0%、NTU RGB+D 120のクロスサブジェクト分割において89.8%、NW-UCLAにおいて97.0%という高い精度を達成し、複数のスケルトンベース行動認識ベンチマークにおいて既存の最先端手法を上回った。

InfoGCN:人間の骨格に基づく行動認識のための表現学習 | 最新論文 | HyperAI超神経