
摘要
自动ICD编码(即将国际疾病分类代码分配给患者就诊)因其能够节省账单处理的时间和人力而吸引了大量研究关注。此前的最先进模型使用了一个卷积层来构建文档表示,以预测ICD代码。然而,不同文档中的文本片段长度和语法差异很大,这些因素与ICD编码密切相关。因此,扁平且固定长度的卷积架构可能无法学习到良好的文档表示。在本文中,我们提出了一种多滤波器残差卷积神经网络(MultiResCNN)用于ICD编码。我们的模型创新之处在于两个方面:一是使用了多滤波器卷积层来捕捉不同长度的多种文本模式;二是采用了残差卷积层以扩大感受野。我们在广泛使用的MIMIC数据集上评估了我们模型的有效性。在MIMIC-III的完整代码集中,我们的模型在6个评估指标中的4个指标上优于最先进模型。在MIMIC-III的前50个代码集和MIMIC-II的完整代码集中,我们的模型在所有评估指标上均优于现有的及最先进模型。代码可在https://github.com/foxlf823/Multi-Filter-Residual-Convolutional-Neural-Network 获取。