
摘要
最先进的联合实体识别和关系抽取模型强烈依赖于外部自然语言处理(NLP)工具,如词性标注器(POS tagger)和依存句法分析器。因此,这些联合模型的性能取决于从这些NLP工具中获得的特征的质量。然而,对于不同的语言和上下文,这些特征并不总是准确的。在本文中,我们提出了一种无需任何手动提取特征或使用任何外部工具即可同时进行实体识别和关系抽取的联合神经模型。具体而言,我们使用条件随机场(CRF)层对实体识别任务进行建模,并将关系抽取任务视为一个多头选择问题(即,为每个实体潜在地识别多个关系)。我们设计了广泛的实验方案,以证明我们的方法在不同上下文(如新闻、生物医学、房地产)和语言(如英语、荷兰语)的数据集上的有效性。我们的模型超越了之前使用自动提取特征的神经模型,在性能上与基于特征的神经模型相差不大,甚至超过了它们。