16日前

UNIK:現実世界におけるスケルトンベースの行動認識のための統合枠組み

Di Yang, Yaohui Wang, Antitza Dantcheva, Lorenzo Garattoni, Gianpiero Francesca, Francois Bremond
UNIK:現実世界におけるスケルトンベースの行動認識のための統合枠組み
要約

骨格データに基づく行動認識は、近年、注目が集まり、著しい進展を遂げている。グラフ畳み込みネットワーク(GCN)を採用した最先端の手法は、事前に定義された人間のトポロジーに基づいて、人間の骨格から効果的に特徴を抽出できる。しかし、こうした進展にもかかわらず、GCNに基づく手法は、特に異なる人間のトポロジー構造を有するドメイン間での一般化能力に課題を抱えている。このような状況を踏まえ、本研究では、人間の骨格シーケンス上で空間時系列特徴を効果的に学習できるだけでなく、複数のデータセット間でも良好な一般化性能を発揮する新たな骨格ベース行動認識手法「UNIK」を提案する。この成果は、マルチヘッドアテンション機構を用いて、一様分布から最適な依存関係行列を学習することによって達成される。さらに、実世界の動画における骨格ベース行動認識のドメイン間一般化能力を検証するため、新規に作成された「Posetics」データセットを用いて、最先端手法および提案手法UNIKの再評価を実施した。Poseticsデータセットは、Kinetics-400の動画からポーズを推定・精緻化・フィルタリングすることで構築されたものである。本研究では、行動分類タスクにおいて、Posetics上で事前学習を行った後の小型ベンチマークデータセット上での性能向上の度合いについて分析を提供する。実験結果から、Posetics上で事前学習を施した提案手法UNIKが、Toyota Smarthome、Penn Action、NTU-RGB+D 60、NTU-RGB+D 120の4つのターゲット行動分類データセットに転移した際に、最先端手法を上回る良好な一般化性能を発揮することが明らかになった。

UNIK:現実世界におけるスケルトンベースの行動認識のための統合枠組み | 最新論文 | HyperAI超神経