17日前
HiTrans:会話における感情検出のためのTransformerベースの文脈および話者に敏感なモデル
{Yijiang Liu, Meishan Zhang, Fei Li, Donghong Ji, Jingye Li}

要約
会話内の感情検出(Emotion Detection in Conversations: EDC)とは、複数の発話者を含む会話において、各発話ごとに感情を検出するタスクである。従来の非会話型感情検出とは異なり、EDC用のモデルは文脈に敏感であること(すなわち、単一の発話ではなく会話全体の理解を必要とする)と、発話者に敏感であること(すなわち、どの発話がどの発話者に属するかを認識できる)が求められる。本論文では、このような文脈および発話者に敏感な特性を持つTransformerベースのモデル、すなわちHiTransを提案する。HiTransは2段階の階層型Transformerから構成されており、低レベルのTransformerとしてBERTを用いて局所的な発話表現を生成し、その表現を高レベルのTransformerに入力することで、発話表現が会話全体のグローバルな文脈に依存するようにする。さらに、モデルの発話者に敏感な特性を強化するため、ペアワイズ発話者検証(Pairwise Utterance Speaker Verification: PUSV)という補助タスクを導入する。このタスクは、2つの発話が同一の発話者に属するかどうかを分類することを目的としている。提案モデルは、EmoryNLP、MELD、IEMOCAPの3つのベンチマークデータセット上で評価された結果、従来の最先端モデルを上回る性能を示した。