11日前

S+PAGE:会話における感情認識のための話者および位置に配慮したグラフニューラルネットワークモデル

Chen Liang, Chong Yang, Jing Xu, Juyang Huang, Yongliang Wang, Yang Dong
S+PAGE:会話における感情認識のための話者および位置に配慮したグラフニューラルネットワークモデル
要約

会話中の感情認識(ERC)は、近年、幅広い応用分野における必要性から注目を集めている。従来のERC手法は、主に自己文脈(self-context)と発話者間文脈(inter-speaker context)を別々にモデル化する傾向にあり、その結果、両者間の十分な相互作用が欠如するという重大な課題が生じている。本稿では、Transformerと関係性グラフ畳み込みネットワーク(R-GCN)の利点を活かすための、新たなSpeaker and Position-Aware Graph Neural Networkモデル(S+PAGE)を提案する。本モデルは、文脈モデリングの精度を向上させるために3段階の構成を採用している。まず、各発話に対して粗い自己文脈および発話者間文脈特徴を抽出するための二重ストリーム会話型Transformerを提案する。次に、発話者と位置情報を意識した会話グラフを構築し、相対的位置符号化(relative positional encoding)を用いて粗い特徴を精緻化するための拡張型R-GCNモデル、すなわちPAG(Position-Aware Graph)を導入する。最後に、前二段階で得られた特徴を統合し、条件付き確率場(Conditional Random Field: CRF)層に投入することで、感情の伝達過程をモデル化する。

S+PAGE:会話における感情認識のための話者および位置に配慮したグラフニューラルネットワークモデル | 最新論文 | HyperAI超神経