2 个月前

一种用于联合医学关系抽取的双向树标注方案

Xukun Luo; Weijie Liu; Meng Ma; Ping Wang
一种用于联合医学关系抽取的双向树标注方案
摘要

联合医学关系抽取是指利用单一模型从医学文本中提取由实体和关系组成的三元组。一种解决方案是将此任务转化为序列标注任务。然而,在现有研究中,线性表示和标注三元组的方法无法处理重叠的三元组,而将三元组组织成图的方法则面临巨大的计算成本挑战。在本文中,受到医学文本中树状关系结构的启发,我们提出了一种新的方案——双向树标注(Bidirectional Tree Tagging, BiTT),该方案将医学关系三元组构建成两个二叉树,并将这些树转换为词级别的标签序列。基于BiTT方案,我们开发了一个联合关系抽取模型,用于预测BiTT标签并进一步高效地抽取医学三元组。我们的模型在两个医学数据集上的F1分数分别比最佳基线模型高出2.0%和2.5%。此外,采用我们BiTT方案的模型在其他领域的三个公开数据集中也取得了令人鼓舞的结果。