HyperAIHyperAI

Command Palette

Search for a command to run...

多層注意リカレントネットワークによる人間のコミュニケーション理解

Amir Zadeh; Paul Pu Liang; Soujanya Poria; Prateek Vij; Erik Cambria; Louis-Philippe Morency

概要

人間の対面コミュニケーションは複雑な多モーダル信号である。私たちは言葉(言語モーダル)、ジェスチャー(視覚モーダル)、そして音調の変化(音響モーダル)を使用して自分の意図を伝える。人間は対面コミュニケーションを容易に処理し理解することができるが、この形式のコミュニケーションを理解することは人工知能(AI)にとって依然として大きな課題である。本論文では、人間のコミュニケーションを理解するための新しいニューラルアーキテクチャであるマルチアテンションリカレントネットワーク(Multi-attention Recurrent Network: MARN)を提案する。当モデルの主な強みは、時間軸上で各モーダル間の相互作用を見つけるために使用されるニューラルコンポーネントであるマルチアテンションブロック(Multi-attention Block: MAB)と、その相互作用を長短期ハイブリッドメモリー(Long-short Term Hybrid Memory: LSTHM)という再帰的コンポーネントのハイブリッドメモリーに保存することにある。我々は6つの公開データセットにおいて多モーダル感情分析、話者特性認識、感情認識について広範な比較を行った。MARNはすべてのデータセットで最先端の性能を示した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています