
要約
患者訪問に国際疾病分類コード(ICDコード)を割り当てる自動化されたICDコーディングは、請求業務の時間と労力を節約できるため、多くの研究者の注目を集めています。従来の最先端モデルでは、1つの畳み込み層を使用して文書表現を構築し、ICDコードを予測していました。しかし、ICDコーディングと密接に関連するテキスト断片の長さや文法は、異なる文書間で大きく異なります。したがって、平らで固定長の畳み込みアーキテクチャでは、良好な文書表現を学習することが困難である可能性があります。本論文では、多様な長さのテキストパターンを捉えるために多フィルタ畳み込み層を使用し、受容野を拡大するために残差畳み込み層を使用する多フィルタ残差畳み込みニューラルネットワーク(MultiResCNN)を提案しました。当モデルの革新点は二つあります:一つ目は多フィルタ畳み込み層を使用することで、様々な長さのテキストパターンを捉えることができることです。二つ目は残差畳み込み層を使用することで、受容野を拡大できることです。我々は広く使用されているMIMICデータセット上で当モデルの有効性を評価しました。MIMIC-IIIの全コードセットにおいて、当モデルは6つの評価指標中的に4つで従来の最先端モデルを超える性能を示しました。また、MIMIC-IIIのトップ50コードセットおよびMIMIC-IIの全コードセットにおいて、当モデルはすべての既存および最先端モデルを超える性能を示しました。本研究で使用したコードは以下のURLから入手可能です:https://github.com/foxlf823/Multi-Filter-Residual-Convolutional-Neural-Network