12 天前

HTSS:一种新型混合文本摘要与简化架构

{Raheel Nawaz, Naif Radi Aljohani, Saeed-Ul Hassan, Matthew Shardlow, Farooq Zaman}
摘要

文本简化与文本摘要虽密切相关,但在自然语言生成(Natural Language Generation)领域属于不同的子任务。摘要任务旨在在保留原文语义的前提下缩短文档长度,而简化任务则侧重于降低文档的复杂程度。在本研究中,我们提出了一种新颖的混合架构——抽象式与抽取式摘要相结合的HTSS模型,将摘要与简化任务统一处理。在此基础上,我们对经典的指针生成器(pointer generator)模型进行了扩展,以支持摘要与简化联合任务。我们从科学新闻网站EurekaAlert(www.eurekalert.org)上由领域专家撰写的简化摘要中构建了平行语料库。实验结果表明,所提出的HTSS模型在SARI评分上优于神经文本简化(Neural Text Simplification, NTS)模型,在ROUGE评分上则优于抽象式文本摘要(Abstractive Text Summarization, ATS)模型。为进一步评估联合任务性能,我们引入了一种新指标CSS1,该指标综合了SARI与ROUGE分数。实验显示,HTSS模型在简化与摘要联合任务上的表现分别优于NTS和ATS模型达38.94%和53.40%。为促进后续研究,我们已将全部代码、训练模型及语料库公开发布至以下地址:https://github.com/slab-itu/HTSS/。

HTSS:一种新型混合文本摘要与简化架构 | 最新论文 | HyperAI超神经