要約
会話内の感情認識(Emotion Recognition in Conversations: ERC)は、会話文脈を前提として各発話に対する感情ラベルを予測するという顕著な柔軟性から、近年注目を集めている。特定の発話の感情を正確に識別するためには、文脈情報と融合された意味の表現を適切にモデル化することが不可欠である。近年の多くの研究では、局所的・グローバルな文脈や話者レベルにおける内話者間・跨話者間の統合を通じて、さまざまな種類の文脈情報を支援情報として捉え、それらを異なる方法で統合することに注力している。しかし、文脈統合後の語彙表現(word representations)の重要性についてはまだ十分に検討されておらず、語彙情報自体も会話における話者の感情を反映する上で極めて重要である。本研究では、多レベルの文脈統合と融合された文表現における語ベクトル表現の蓄積(accumulation)が与える影響を明らかにすることを目指す。その目的の下、ERCタスクにおける文表現モデリングの効果的な手法を提案し、広く用いられている4つのベンチマークデータセット(IEMOCAP、MELD、EmoryNLP、DailyDialog)において、競争力のある最先端の性能を達成した。本研究のソースコードは以下のリンクから公開されている:github.com/yingjie7/per_erc/tree/AccumWR。