
摘要
生物医学事件抽取在理解科学文献中描述的生物分子相互作用方面具有重要意义。其中一项主要挑战在于识别与非指示性触发词相关联的嵌套结构化事件。为此,我们提出通过图边条件注意力网络(GEANet)与分层图表示,将统一医学语言系统(UMLS)中的领域知识融入预训练语言模型。为更准确地识别触发词,首先基于UMLS联合建模的分层知识图谱,将每个句子映射为一个句子级图结构。随后,利用GEANet——一种新型图神经网络——对这些图结构进行传播,以增强对复杂事件的推理能力。在BioNLP 2011 GENIA事件抽取任务上,我们的方法在所有事件和复杂事件上的F1值分别提升了1.41%和3.19%。消融实验进一步验证了GEANet与分层知识图谱的重要性。