18日前

発話構造と整合化されたコード埋め込みを活用した自動ICDコード付与

{Wanchun Yang, Bo Sang, Fuxin Zhang, Bozheng Zhang, Shurui Zhang}
発話構造と整合化されたコード埋め込みを活用した自動ICDコード付与
要約

国際疾病分類(ICD)は、世界の健康統計および疫学の基盤をなすものであり、健康状態をアルファベットと数字のコードに変換するための仕組みとして設計されている。手動によるICDコード付与は人的負担が大きく、世界的に医療従事者の不足が深刻な問題であるため、自動ICDコード付与のためのさまざまなアプローチが提案されてきた。しかし、従来の研究では、臨床ノートの話法構造(discourse structure)が十分に活用されておらず、コード付与に必要な豊富な文脈情報を提供する可能性が損なわれていた。本論文では、セクション種別分類とセクション種別埋め込み(section type embeddings)を活用することで、臨床ノートの話法構造を有効に活用する。さらに、クラス不均衡問題および臨床ノートとICDコード定義との間の文章スタイルの異質性に注目し、提案する「統合埋め込み(reconciled embedding)」アプローチにより、これらを同時に解決することを可能にした。MIMICデータセットを用いた実験結果から、本モデルが従来の最先端モデルを大幅に上回ることを確認した。ソースコードは、https://github.com/discnet2022/discnet にて公開されている。