2 个月前

野生语篇连贯性:一个数据集、评估和方法

Alice Lai; Joel Tetreault
野生语篇连贯性:一个数据集、评估和方法
摘要

迄今为止,针对真实世界数据的篇章连贯性方法评估工作非常有限。为了解决这一问题,我们介绍了一个新的真实世界文本语料库(GCDC)以及首次对领先篇章连贯性算法进行的大规模评估。研究结果表明,神经模型,包括我们在此提出的两种新模型(SentAvg 和 ParSeq),通常表现最佳。我们分析了这些性能差异,并讨论了在四个领域中观察到的低连贯性文本模式。

野生语篇连贯性:一个数据集、评估和方法 | 最新论文 | HyperAI超神经