
要約
これまで、実世界データにおけるディスコースの一貫性評価手法に関する研究はほとんど行われてきませんでした。この課題に対処するため、私たちは新しい実世界テキストのコーパス(GCDC)を提示するとともに、主要なディスコースの一貫性アルゴリズムの初めての大規模評価を行います。私たちが導入した2つのニューラルモデル(SentAvgおよびParSeq)を含め、ニューラルモデルが一般的に最良の性能を示すことを示しています。これらの性能差を分析し、4つの分野における一貫性の低いテキストで観察されたパターンについて議論します。