16 天前

自上而下的篇章解析:基于序列标注的方法

Fajri Koto, Jey Han Lau, Timothy Baldwin
自上而下的篇章解析:基于序列标注的方法
摘要

我们提出一种自顶向下的篇章分析方法,其概念上比先前的方法(Kobayashi 等,2020;Zhang 等,2020)更为简洁。通过将该任务建模为序列标注问题,旨在迭代地将文档分割为独立的篇章单元,我们得以省去解码器模块,并显著缩小分割点的搜索空间。我们在该任务中同时探索了传统的循环神经网络模型与现代预训练的 Transformer 模型,并进一步提出了一种新颖的动态最优标签(dynamic oracle)机制,用于支持自顶向下的解析过程。基于 Full 指标,我们提出的 LSTM 模型在 RST(语篇结构树)解析任务上达到了新的最先进水平。

自上而下的篇章解析:基于序列标注的方法 | 最新论文 | HyperAI超神经