11 天前

多领域研究论文中的指代消解

Arthur Brack, Daniel Uwe Müller, Anett Hoppe, Ralph Ewerth
多领域研究论文中的指代消解
摘要

共指消解对于自动文本理解至关重要,是实现文本摘要、问答系统等高级信息检索任务的基础。以往研究表明,当前最先进的方法(如基于BERT的模型)在应用于科研论文时,性能显著下降。本文针对科研论文中的共指消解任务及其后续知识图谱构建展开研究,并提出以下贡献:(1)我们构建了一个共指消解语料库,涵盖来自科学(Science)、技术(Technology)与医学(Medicine)(STM)领域的10个不同学科;(2)我们提出了一种面向科研论文的迁移学习方法,用于实现自动共指消解;(3)我们系统分析了共指消解对知识图谱(Knowledge Graph, KG)构建质量的影响;(4)我们发布了由55,485篇来自10个STM领域科研论文自动生成的知识图谱。全面的实验结果表明,所提出方法具有显著实用性。我们的迁移学习方法在自建语料库上的F1得分达到61.4,较现有最先进基线模型提升11.0个百分点;在与人工标注的黄金标准知识图谱对比评估中,共指消解使生成知识图谱的质量显著提升,F1得分达到63.5,相较基线提升21.8个百分点。

多领域研究论文中的指代消解 | 最新论文 | HyperAI超神经