
要約
マルチパーティ会話は単独の発話や文書に比べて構造がやや緩やかであるものの、対話の各ターン間における意味レベルの相関関係によって暗黙的に組織化されており、対話ディスコース解析を用いることで、基本的なディスコースユニット間の依存構造や関係を予測し、下流タスクに豊かな構造情報を提供することが可能である。しかし、現在利用可能な対話ディスコースアノテーション付きコーパスは、特定のドメインから収集されており、サンプル数が限られているため、ドメイン適応を施さない新規対話データに対してデータ駆動型アプローチの性能が低くなる傾向にある。本論文では、まずTransformerベースのパーサーを提案し、そのドメイン間汎用性を評価する。次に、データと言語モデリングの両側面から、ドメイン統合を実現するための3つの手法を採用し、モデルの汎化能力を向上させる。実験結果から、提案手法によりニューラルパーサーが効果的に恩恵を受け、ドメイン間対話サンプルにおいてより優れた性能を発揮することが示された。