
要約
対話ディスコース解析は、マルチ参加者の会話を構成する内部構造を明らかにするために、すべてのディスコースリンクとそれに対応する関係を見つけることを目指しています。従来の研究では、このタスクを独立した複数の選択問題として扱い、リンクの存在と関係を別々にデコードするか、またはエンコーディングを局所的な相互作用に制限し、全体的な構造情報を無視していました。これに対して、我々はエンコーディングとデコードの2つの観点から従来の研究を改善する体系的な方法を提案します。エンコーディング側では、隣接行列に対する構造化エンコーディングを行い、その後マトリックスツリー学習アルゴリズムを使用することで、対話内のすべてのディスコースリンクと関係が潜在的なツリーレベル分布に基づいて共同で最適化されます。デコード側では、修正されたChiu-Liu-Edmondsアルゴリズムを使用して構造化推論を行い、明示的に最もディスコース構造を捉えているラベル付き多根非射影展開木を生成します。さらに、我々の手法では手作業で設計された特徴量に依存せず、モデルの堅牢性が向上します。実験結果は、我々の手法が新しい最先端性能を達成し、STACデータセットでは2.3ポイント(F1値)、Molweniデータセットでは1.5ポイント(F1値)で従来のモデルを超えたことを示しています。\footnote{コードは\url{https://github.com/chijames/structured_dialogue_discourse_parsing}で公開されています。}