2ヶ月前

臨床テキストからのICDコーディング用ラベル注意モデル

Thanh Vu; Dat Quoc Nguyen; Anthony Nguyen
臨床テキストからのICDコーディング用ラベル注意モデル
要約

ICDコーディングは、医療専門家(例:臨床医)が記録した臨床/医療ノートに国際疾病分類の診断コードを割り当てるプロセスです。このプロセスには多大な人的リソースが必要であり、コストがかかり、誤りが生じやすいという問題があります。これらの課題に対処するため、機械学習が自動ICDコーディングに利用されています。従来の最先端モデルは、単一または複数の固定ウィンドウサイズを使用する畳み込みニューラルネットワークに基づいていました。しかし、臨床テキストにおけるICDコードに関連するテキスト断片の長さと相互依存関係は大きく異なり、最適なウィンドウサイズを決定することが困難となっています。本論文では、このような長さの違いと相互依存関係を扱うことができる新しいラベルアテンションモデルを提案します。さらに、多くのICDコードが頻繁に使用されないため、極めてデータの偏りが生じる問題に対処するために、コード間の階層的関係を利用した階層的共同学習メカニズムも提案しています。このメカニズムにより、ラベルアテンションモデルを拡張し、データの偏り問題を解決します。我々のラベルアテンションモデルは3つのベンチマークMIMICデータセットで新たな最先端結果を達成しており、階層的共同学習メカニズムは頻度が低いコードの性能向上に寄与しています。