
摘要
基于表示学习的监督模型在预测各类属性任务中已展现出极高的准确性。例如,BERT系列模型在从命名实体识别(NER)标注到多种语言学任务的下游任务中均表现出色。然而,医学领域所使用的词汇包含大量仅限于医疗行业的专有词汇,如不同疾病名称、医疗器械、生物体、药物等,这使得传统BERT模型难以生成有效的上下文嵌入表示。本文提出了一种基于Bio-BERT的命名实体识别系统。实验结果表明,所提模型在性能上显著优于基线模型,在F1分数上位列第四,仅以2.21分之差落后于最优模型;而在召回率(Recall)指标上位居第一,表现优异。