Command Palette
Search for a command to run...
会話中の感情認識のためのグラフニューラルネットワークを用いた静的および動的スピーカーモデリング
会話中の感情認識のためのグラフニューラルネットワークを用いた静的および動的スピーカーモデリング
Sadao Kurohashi Yin Jou Huang Prakhar Saxena
概要
各個人には感情の感じ方や表現方に影響を与える独自の性格が存在する。そのため、会話における感情認識(Emotion Recognition in Conversation, ERC)のタスクにおいて、話者のモデリングは重要である。本稿では、会話の文脈と話者の性格の両方を考慮した新しいグラフベースのERCモデルを提案する。我々は、話者の内面状態(性格)を「静的(Static)」および「動的(Dynamic)」話者状態としてモデル化し、動的話者状態はグラフニューラルネットワーク(GNN)に基づくエンコーダによって表現する。標準データセットを用いた実験の結果、提案モデルの有効性が示された。また、ベースラインモデルおよび他のグラフベース手法と比較して、本モデルは優れた性能を発揮した。結果の分析から、話者を明示的にモデリングすることが重要であることも明らかになった。