2ヶ月前
MIMIC-IIIおよびMIMIC-IVにおける自動医療コード付け:批判的レビューと再現性研究
Joakim Edin; Alexander Junge; Jakob D. Havtorn; Lasse Borgholt; Maria Maistro; Tuukka Ruotsalo; Lars Maaløe

要約
医療コード付けは、臨床のフリーテキスト記録に医療コードを割り当てる作業です。医療専門家が手動でこれらのコードを割り当てることで、患者の診断と治療を追跡しています。自動化された医療コード付けは、この管理負担を大幅に軽減することができます。本論文では、最先端の自動化された医療コード付けの機械学習モデルを再現し、比較し、分析します。我々は、いくつかのモデルが弱い設定や不適切なサンプリングによる訓練・テスト分割、および十分でない評価のために性能が低下していることを示します。過去の研究ではマクロ F1 スコアが最適ではなく計算されていましたが、我々の訂正によりそのスコアが倍増しました。我々は層別サンプリングと同一の実験環境(ハイパーパラメータや決定境界調整を含む)を使用した改訂版モデル比較に貢献します。予測エラーを分析することで、過去の研究における仮説を検証し、否定します。分析結果はすべてのモデルが稀なコードに対して苦戦している一方で、長いドキュメントは僅かな影響しか与えないことを確認しています。最後に、新しく公開された MIMIC-IV データセットについて再現したモデルを使用した初めての包括的な結果を提示します。公平な将来の比較のために、我々はコード、モデルパラメータ、新しい MIMIC-III および MIMIC-IV の訓練・評価パイプラインを公開します。以上が翻訳となります。ご確認ください。