16 天前

摘要循环:在无示例情况下学习生成摘要

Philippe Laban, Andrew Hsi, John Canny, Marti A. Hearst
摘要循环:在无示例情况下学习生成摘要
摘要

本文提出了一种新的无监督抽象摘要生成方法,该方法在给定长度约束下,通过最大化摘要的覆盖度与流畅度的综合指标来实现。该方法引入了一种新机制:强制在摘要中包含原始文档中的关键术语——具体做法是将原始文档中的关键术语进行掩码处理,要求覆盖模型利用当前生成的摘要内容来恢复这些被掩码的术语。此外,本文还设计了一种新颖的无监督训练流程,结合覆盖模型与流畅度模型,用于生成并评估摘要质量。在多个主流新闻摘要数据集上的实验结果表明,该方法相较于以往的无监督方法,F1得分(R-1)提升超过2个百分点,其性能已接近表现优异的监督学习方法。所提出的模型在实现更高抽象程度的同时,复制的原文片段长度仅为先前方法的约二分之一,并且能够在无监督条件下有效实现句子的压缩与合并。

摘要循环:在无示例情况下学习生成摘要 | 最新论文 | HyperAI超神经