11 天前

SATS:面向简化感知的科学文献文本摘要

{Naif Radi Aljohani, Asim Karim, Saeed-Ul Hassan, Matthew Shardlow, Faisal Kamiran, Farooq Zaman}
SATS:面向简化感知的科学文献文本摘要
摘要

将学术出版物的摘要进行简化,已成为向更广泛受众传播科学发现的常用方法。尽管文本摘要旨在缩短长篇文档,但文本简化则致力于降低文档的复杂性。为同时实现这两项任务,亟需开发能够缩短并简化长文本的机器学习方法。本研究提出了一种基于未来n-gram预测的新型“简化感知文本摘要模型”(Simplification Aware Text Summarization, SATS)。该模型在文本摘要模型ProphetNet的基础上进行扩展,通过引入词频词典优化目标函数,以提升在文本简化任务中的表现。我们在一个新发布的文本摘要与简化语料库上评估了SATS的性能,该语料库包含5,400对科学论文。自动评估结果表明,SATS在ROUGE、SARI和CSS1三项指标上均优于当前最先进的模型,在两个数据集上均展现出在文本简化、摘要生成以及联合简化-摘要任务中的卓越性能。此外,我们还对SATS生成的摘要进行了人工评估。由八位标注者对100份摘要从语法正确性、连贯性、一致性、流畅性及简洁性五个维度进行了评分。各项指标的平均人类评分在1至5分量表上介于4.0至4.5之间,其中1分为低,5分为高,表明生成摘要在整体质量上表现优异。

SATS:面向简化感知的科学文献文本摘要 | 最新论文 | HyperAI超神经