2 个月前
一种简单而强大的端到端神经RST风格篇章分析基线方法
Naoki Kobayashi; Tsutomu Hirao; Hidetaka Kamigaito; Manabu Okumura; Masaaki Nagata

摘要
为了促进和进一步发展RST(修辞结构理论)式的篇章分析模型,我们需要一个强大的基线模型,该模型可以作为报告可靠实验结果的参考。本文通过整合现有的简单解析策略(自上而下和自下而上)与各种基于变压器的预训练语言模型,探索了一个强大的基线模型。从两个基准数据集获得的实验结果表明,解析性能在很大程度上依赖于预训练语言模型而非解析策略。特别是,当使用DeBERTa时,自下而上的解析器相比当前最佳解析器实现了显著的性能提升。我们进一步分析了句内和跨句解析以及核心性预测,发现采用跨度掩码方案的语言模型特别提升了解析性能。