4ヶ月前

マルチモーダル

マルチモーダル表現

マルチモーダル

コンピュータビジョン

Shahroudy Amir Wang Gang Ng Tian-Tsong Yang Qingxiong

概要

人間の行動はアーティキュレートされ、複雑な性質を有しているため、行動認識の課題は困難である。この複雑性に対処する手法の一つとして、身体部位の運動学的特性に分けて扱い、これらの部分的記述子に基づいて行動を分析するアプローチがある。本研究では、各行動を、スパースな身体部位集合から得られるマルチモーダル特徴の組み合わせとしてモデル化するために、構造的スパース性を活用した同時スパース回帰に基づく学習手法を提案する。部位の動的特性および外観を表現するため、深度情報とスケルトンに基づく異種特徴を用いる。提案する階層的混合ノルムを用いて、マルチモーダルな複数部位特徴の適切な構造を学習フレームワークに組み込み、各部位の構造的特徴を正則化するとともに、部位間のスパース性を導入し、グループ特徴選択を促進する。実験結果から、提案手法が有効であることが示された。3つのテストデータセットすべてにおいて、他の手法を上回り、そのうち1つのデータセットでは完全な正確率（100%）を達成した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

4ヶ月前

マルチモーダル

マルチモーダル表現

マルチモーダル

コンピュータビジョン

Shahroudy Amir Wang Gang Ng Tian-Tsong Yang Qingxiong

概要

人間の行動はアーティキュレートされ、複雑な性質を有しているため、行動認識の課題は困難である。この複雑性に対処する手法の一つとして、身体部位の運動学的特性に分けて扱い、これらの部分的記述子に基づいて行動を分析するアプローチがある。本研究では、各行動を、スパースな身体部位集合から得られるマルチモーダル特徴の組み合わせとしてモデル化するために、構造的スパース性を活用した同時スパース回帰に基づく学習手法を提案する。部位の動的特性および外観を表現するため、深度情報とスケルトンに基づく異種特徴を用いる。提案する階層的混合ノルムを用いて、マルチモーダルな複数部位特徴の適切な構造を学習フレームワークに組み込み、各部位の構造的特徴を正則化するとともに、部位間のスパース性を導入し、グループ特徴選択を促進する。実験結果から、提案手法が有効であることが示された。3つのテストデータセットすべてにおいて、他の手法を上回り、そのうち1つのデータセットでは完全な正確率（100%）を達成した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

深度動画における行動認識のためのマルチモーダル・マルチパート学習 | 記事 | HyperAI超神経