
摘要
实体和关系的联合抽取是信息抽取领域的一个重要任务。为了解决这一问题,我们首先提出了一种新颖的标记方案,该方案可以将联合抽取任务转化为一个标记问题。然后,基于我们的标记方案,研究了不同的端到端模型,以直接抽取实体及其关系,而无需分别识别实体和关系。我们在通过远监督方法生成的公开数据集上进行了实验,实验结果表明,基于标记的方法优于大多数现有的流水线和联合学习方法。此外,本文提出的端到端模型在公开数据集上取得了最佳结果。
实体和关系的联合抽取是信息抽取领域的一个重要任务。为了解决这一问题,我们首先提出了一种新颖的标记方案,该方案可以将联合抽取任务转化为一个标记问题。然后,基于我们的标记方案,研究了不同的端到端模型,以直接抽取实体及其关系,而无需分别识别实体和关系。我们在通过远监督方法生成的公开数据集上进行了实验,实验结果表明,基于标记的方法优于大多数现有的流水线和联合学习方法。此外,本文提出的端到端模型在公开数据集上取得了最佳结果。