Command Palette
Search for a command to run...
深度動画における行動認識のためのマルチモーダル・マルチパート学習
深度動画における行動認識のためのマルチモーダル・マルチパート学習
Shahroudy Amir Wang Gang Ng Tian-Tsong Yang Qingxiong
概要
人間の行動はアーティキュレートされ、複雑な性質を有しているため、行動認識の課題は困難である。この複雑性に対処する手法の一つとして、身体部位の運動学的特性に分けて扱い、これらの部分的記述子に基づいて行動を分析するアプローチがある。本研究では、各行動を、スパースな身体部位集合から得られるマルチモーダル特徴の組み合わせとしてモデル化するために、構造的スパース性を活用した同時スパース回帰に基づく学習手法を提案する。部位の動的特性および外観を表現するため、深度情報とスケルトンに基づく異種特徴を用いる。提案する階層的混合ノルムを用いて、マルチモーダルな複数部位特徴の適切な構造を学習フレームワークに組み込み、各部位の構造的特徴を正則化するとともに、部位間のスパース性を導入し、グループ特徴選択を促進する。実験結果から、提案手法が有効であることが示された。3つのテストデータセットすべてにおいて、他の手法を上回り、そのうち1つのデータセットでは完全な正確率(100%)を達成した。