
要約
本論文では、修辞構造理論(Rhetorical Structure Theory, RST)の枠組み内における話法解析のための新たなアルゴリズムを提案する。本手法は、統計的機械学習分野における最近の進展(サポートベクターマシンの多変量処理能力)と豊富な特徴空間を基盤としている。RSTは、階層的なテキスト構造を形式的に定式化する枠組みを提供しており、話法分析やテキスト生成における強力な応用が期待されている。我々は、入力テキストに対してRSTに基づく階層的関係を自動的に注釈する手法を提示し、専門的に訓練された人間のアノテーターと同等の性能を達成することを実証した。入力テキストから得られる豊富な浅層的語彙的・構文的・構造的特徴を活用することで、本解析器は線形時間で、専門アノテーター間の一致度(Fスコア)の73.9%を達成している。また、現在の最先端の解析器と比較して、5%から12%の高い精度を実現している。