
要約
複数パーティによる複数ターン対話理解は、複数の発話者から生じる複雑な状況および発話者に依存する発話間における交差する話法的関係を扱う上で、前例のない課題をもたらしている。既存の大多数の手法は対話文脈を単なるテキストとして扱い、発話者に依存する重要な手がかりに十分な注意を払っていない。本研究では、マスキングアテンションと異種グラフネットワークを組み合わせた強化された発話者に依存するモデルを提案する。このモデルは、発話者の属性と発話者に依存する関係性の両側面から、話法的関係の手がかりを包括的に捉えることを可能にする。包括的な発話者に依存するモデリングにより、実験結果から本モデルがベンチマークデータセットMolweniにおいて最先端の性能を達成することを示した。ケース分析の結果、本モデルは発話とその発話者との間の関連性を強化し、発話者に依存する話法的関係を正確に捉えることができた。これは、対話モデリングにおいて極めて重要な要素である。