
要約
我々は、論理構造理論(Rhetorical Structure Theory: RST)の枠組みにおいて、文書レベルのディスコース解析の新しい上位から下位への一貫した定式化を提案します。この定式化では、トークン境界での分割決定の系列としてディスコース解析を考え、seq2seqネットワークを使用して分割決定をモデル化します。当該フレームワークは、ディスコースセグメンテーションを前提とすることなくゼロからディスコース解析を行うことを容易にし、むしろセグメンテーションが解析プロセスの一環として得られます。我々の統合されたパーシングモデルは、高評価の木構造空間を探索することで最適な木構造をデコードするためのビームサーチを採用しています。標準的な英語RSTディスコースツリーバンクにおける広範な実験を通じて、我々のパーサーがゴールドセグメンテーションを使用した場合でも一貫したパーシングにおいて既存手法を大幅に上回ることを示しています。より重要なのは、手作業で特徴量を作成することなくこれを行うことができることで、これにより処理速度が向上し、新しい言語や領域への適用も容易になります。