
摘要
科学文献包含多种领域特定的实体及其相互关系。这些实体及其关系能够简洁地捕捉文档主题的重要信息,因此在理解与自动分析文献方面具有关键作用。本文旨在利用深度神经网络模型,自动从科学摘要中提取实体与关系。给定一个输入句子,我们首先使用预训练的Transformer模型生成词元(token)的上下文嵌入表示,并进一步融合其词性(POS)标签的嵌入信息,以丰富词元表征。一系列经过增强的词元表示构成一个跨度(span),实体与关系在跨度上联合学习。实体分类器预测的实体得分(logits)被用作关系分类器的特征输入。实验结果表明,所提出的模型在SciERC和ADE数据集上的实体与关系抽取任务中,均优于现有文献中的竞争性基线方法。