EmotionIC:感情的インertiaおよび連鎖的感染に基づく依存構造モデリングによる対話における感情認識

近年、人間-コンピュータインターフェース技術の進展と実装に伴い、会話における感情認識(Emotion Recognition in Conversation, ERC)は注目を集めている。本論文では、ERCタスクに対し、感情の慣性(inertia)と感情の感染(contagion)を駆動要因とする依存関係モデリング手法であるEmotionICを提案する。本手法EmotionICは、識別子マスク付きマルチヘッドアテンション(Identity Masked Multi-Head Attention, IMMHA)、会話ベースのゲート付き再帰ユニット(Dialogue-based Gated Recurrent Unit, DiaGRU)、およびスキップチェーン条件付き確率場(Skip-chain Conditional Random Field, SkipCRF)の3つの主要構成要素から構成される。従来のERCモデルと比較して、EmotionICは特徴抽出レベルおよび分類レベルの両方で会話の構造をより包括的にモデル化できる。特徴抽出レベルでは、アテンションベースと再帰ベースの手法の利点を統合することを目指しており、IMMHAは発話者に基づくグローバルな文脈依存性を捉えるために、DiaGRUは発話者と時間的側面を考慮したローカルな文脈情報を抽出するために用いられる。分類レベルでは、SkipCRFにより会話内の高次近傍発話から複雑な感情の流れを明示的に抽出可能となる。実験結果から、本手法は4つのベンチマークデータセットにおいて、最先端モデルを顕著に上回ることが示された。アブレーションスタディの結果から、提案モジュールが感情の慣性および感染を効果的にモデル化できていることが確認された。