
要約
会話内の感情認識(ERC)に関する関心は、ユーザー行動の分析や偽情報の検出に応用可能であるため、さまざまな分野で高まっている。近年のERC手法の多くは、発話間の関係性を考慮するためにグラフベースのニューラルネットワークを用いている。特に最先端の手法では、関係性グラフ注意ネットワーク(RGAT)を用いて会話における自己および他話者間の依存関係を捉えている。しかし、従来のグラフベースのニューラルネットワークは、順序情報(時系列情報)を考慮していないという課題がある。本研究では、関係性グラフ構造を反映した順序情報をRGATに提供するための「関係性位置符号化(relational position encodings)」を提案する。これにより、我々のRGATモデルは話者間の依存関係と時系列情報を同時に捉えることが可能となる。4つのERCデータセットを用いた実験の結果、本モデルは会話における感情認識に有効であることが示された。さらに、ベンチマークデータセットすべてにおいて、本手法は最先端手法を実証的に上回る性能を達成した。