2 个月前
基于临床文本的可解释医学代码预测
James Mullenbach; Sarah Wiegreffe; Jon Duke; Jimeng Sun; Jacob Eisenstein

摘要
临床笔记是由医生在每次患者就诊时创建的文本文件。这些笔记通常附有医学代码,用于描述诊断和治疗情况。然而,标注这些代码既费时又容易出错;此外,代码与文本之间的关联未被标注,导致特定诊断和治疗背后的原因和细节变得模糊不清。本文介绍了一种基于注意力机制的卷积神经网络模型,该模型可以从临床文本中预测医学代码。我们的方法利用卷积神经网络在文档中聚合信息,并通过注意力机制选择数千个可能代码中最相关的段落。该方法具有较高的准确性,达到了 Precision@8 为 0.71 和 Micro-F1 为 0.54 的性能指标,均优于此前的最先进水平。此外,通过一位医生对模型可解释性的评估,我们证明了注意力机制能够为每个代码分配提供有意义的解释。