2 个月前

CollaboNet:深度神经网络在生物医学命名实体识别中的协作

Wonjin Yoon; Chan Ho So; Jinhyuk Lee; Jaewoo Kang
CollaboNet:深度神经网络在生物医学命名实体识别中的协作
摘要

背景:在生物医学文本挖掘中,识别生物医学命名实体是最基本的任务之一。近年来,基于深度学习的方法已被应用于生物医学命名实体识别(BioNER),并显示出令人鼓舞的结果。然而,由于深度学习方法需要大量的训练数据,数据不足会阻碍其性能。生物医学命名实体数据集是一种稀缺资源,每个数据集仅涵盖少量的实体类型。此外,许多生物实体具有多义性,这是命名实体识别中的主要障碍之一。结果:为了解决数据不足和实体类型误分类的问题,我们提出了CollaboNet模型,该模型利用了多个命名实体识别(NER)模型的组合。在CollaboNet中,不同数据集上训练的模型相互连接,目标模型可以从其他协作模型获取信息以减少假阳性。每个模型在其目标实体类型上都是专家,并在训练过程中轮流担任目标模型和协作模型的角色。实验结果表明,CollaboNet可以显著减少假阳性和包括多义词在内的误分类实体的数量。CollaboNet在精确度、召回率和F1分数方面均达到了最先进的水平。结论:我们展示了将多个模型结合用于BioNER的优势。通过利用针对不同实体类型注释的多个数据集,我们的模型成功减少了误分类实体的数量,并提高了性能。鉴于我们的模型达到的最先进水平,我们认为CollaboNet可以提高下游生物医学文本挖掘应用(如生物实体关系提取)的准确性。

CollaboNet:深度神经网络在生物医学命名实体识别中的协作 | 最新论文 | HyperAI超神经