2 个月前

使用层次标签注意网络和标签嵌入初始化的可解释自动临床笔记编码

Hang Dong; Víctor Suárez-Paniagua; William Whiteley; Honghan Wu
使用层次标签注意网络和标签嵌入初始化的可解释自动临床笔记编码
摘要

临床笔记的诊断或程序编码旨在提取患者疾病相关信息的编码摘要。这种编码通常在医院中由人工完成,但有可能通过自动化来提高医疗编码的效率和准确性。近期关于利用深度学习进行自动医疗编码的研究取得了令人鼓舞的成果。然而,这些模型的可解释性通常较差,阻碍了它们在支持临床实践中的自信应用。另一个限制是这些模型大多假设标签之间相互独立,忽略了医学代码之间的复杂相关性,而这种相关性可以被利用以提升性能。我们提出了一种分层标签级注意力网络(Hierarchical Label-wise Attention Network, HLAN),该网络通过量化与每个标签相关的词语和句子的重要性(作为注意力权重)来解释模型。其次,我们提出了一种标签嵌入(Label Embedding, LE)初始化方法,该方法学习一个密集的连续向量表示,并将其注入模型的最终层和标签级注意力层中。我们在MIMIC-III出院总结数据集上使用三种设置评估了这些方法:全部代码、前50个代码以及英国NHS COVID-19防护代码。实验结果表明,HLAN在前50个代码预测中实现了最佳的微平均AUC和$F_1$分数,并且在NHS COVID-19防护代码预测中与其他模型相比表现相当。通过突出显示每个标签最显著的词语和句子,HLAN展示了比其降级基线和基于CNN的模型更有意义和全面的模型解释能力。LE初始化方法一致地提升了大多数用于自动医疗编码的深度学习模型性能。

使用层次标签注意网络和标签嵌入初始化的可解释自动临床笔记编码 | 最新论文 | HyperAI超神经