7 个月前

自然语言处理

自然语言处理

Seba Susan Akanksha Karotia

摘要

在信息海量涌入互联网的当今时代，人工提取和消费相关信息不仅困难重重，而且耗时耗力。因此，亟需一种自动化文档摘要工具，以从主题相似或相关的多篇文档中提取关键信息。多文档摘要技术能够在最大限度减少冗余的前提下，从多篇文档中提炼出重要且相关的内容。本研究提出了一种基于无监督提取式方法的多文档文本摘要系统。该模型融合了两种学习范式：T5预训练Transformer模型与K-Means聚类算法。实验在标准新闻文章语料库——文档理解会议（Document Understanding Conference, DUC2004）上进行。采用ROUGE评估指标对所提方法在DUC2004数据集上的性能进行衡量。实验结果表明，与现有的无监督前沿方法相比，本模型在性能上显著提升，验证了其有效性与优越性。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

自然语言处理

自然语言处理

Seba Susan Akanksha Karotia

摘要

在信息海量涌入互联网的当今时代，人工提取和消费相关信息不仅困难重重，而且耗时耗力。因此，亟需一种自动化文档摘要工具，以从主题相似或相关的多篇文档中提取关键信息。多文档摘要技术能够在最大限度减少冗余的前提下，从多篇文档中提炼出重要且相关的内容。本研究提出了一种基于无监督提取式方法的多文档文本摘要系统。该模型融合了两种学习范式：T5预训练Transformer模型与K-Means聚类算法。实验在标准新闻文章语料库——文档理解会议（Document Understanding Conference, DUC2004）上进行。采用ROUGE评估指标对所提方法在DUC2004数据集上的性能进行衡量。实验结果表明，与现有的无监督前沿方法相比，本模型在性能上显著提升，验证了其有效性与优越性。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供