HyperAIHyperAI

Command Palette

Search for a command to run...

Multi-GAT:人間の行動認識のためのグラフィカルなアテンションを用いた階層的マルチモーダル表現学習手法

Tariq Iqbal Md Mofijul Islam

概要

人間の行動認識は、ロボットが人間の周囲で有用に機能するためには不可欠な能力の一つである。現代のロボットは多様なセンサを搭載しているものの、特にノイズの多いセンサデータが存在する状況下では、人間行動認識(HAR)は依然として困難な課題のままである。本研究では、階層的に補完的なマルチモーダル特徴を学習するマルチモーダルグラフィカルアテンションベースのHAR手法、すなわちMulti-GATを提案する。本手法では、特徴の相互作用を可能にするために、モダリティ固有の顕著な特徴を分離・抽出できるマルチモーダル・ミクスチャー・オブ・エキスパートモデルを構築した。さらに、異なるモダリティ間の関係を捉えるために、新たなメッセージ伝達に基づくグラフィカルアテンション手法を導入し、補完的なマルチモーダル特徴の抽出を実現した。2つのマルチモーダル人間行動データセットを用いた実験結果から、Multi-GATはすべてのデータセットおよび評価指標において、最先端のHARアルゴリズムを上回ることが示された。さらに、ノイズを含むセンサデータを用いた実験では、Multi-GATが評価したすべてのベースライン手法を一貫して上回る堅牢な性能を発揮した。これらの結果から、Multi-GATはノイズが存在する人間環境においても、スムーズな人間-ロボット協働を可能にする可能性を示している。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Multi-GAT:人間の行動認識のためのグラフィカルなアテンションを用いた階層的マルチモーダル表現学習手法 | 記事 | HyperAI超神経