2 个月前
基于出院小结的医学编码预测:使用序列注意力机制的文档到序列BERT模型
Tak-Sung Heo; Yongmin Yoo; Yeongjoon Park; Byeong-Cheol Jo; Kyungsun Kim

摘要
临床笔记是在患者就诊过程中由临床医生生成的非结构化文本。通常,这些临床笔记会附带一组来自国际疾病分类(ICD)的元数据代码。ICD代码在保险、报销、医疗诊断等多种操作中具有重要意义。因此,快速准确地分类ICD代码至关重要。然而,为这些代码进行注释既费时又昂贵。为此,我们提出了一种基于双向编码器表示从变压器(BERT)并采用序列注意力方法的模型,用于自动分配ICD代码。我们在医学信息学重症监护III(MIMIC-III)基准数据集上评估了我们的方法。该模型在宏平均F1值上达到了0.62898,在微平均F1值上达到了0.68555,性能优于目前使用MIMIC-III数据集的最佳模型。本研究的贡献在于提出了一种使用BERT的方法,该方法可以应用于文档,并且采用了一种能够捕捉文档中重要序列信息的序列注意力方法。