2ヶ月前

読み、注意を払い、コーディングする:機械による臨床記録からの医療コード予測の限界に挑戦する

Byung-Hak Kim; Varun Ganapathi
読み、注意を払い、コーディングする:機械による臨床記録からの医療コード予測の限界に挑戦する
要約

臨床記録から医療コードを予測することは、現在の医療システムにおけるすべての医療提供組織にとって実践的かつ不可欠なニーズです。人間のコーダーが今日費やす大量の時間と労力を自動注釈化することで節約できます。しかし、最大の課題は、非構造化されたフリーテキストの臨床記録から数千に及ぶ高次元の医療コードを直接特定することです。過去3年間で、畳み込みニューラルネットワーク(CNN)と長短期記憶(LSTM)ネットワークを用いて、MIMIC-IIIフルラベル入院患者臨床記録データセットの最も難しいベンチマークであるMIMIC-III-full-labelに対処する上で大幅な改善が見られました。この進歩は、自動化された機械学習(ML)システムが人間のコーダーの作業性能からどれほど近づいているかという基本的な問いを提起します。私たちは同じサブサンプリングテストセットでの人間のコーダーの基準性能を評価しました。また、医療コード割り当てマッピングを学習するための「Read, Attend, and Code (RAC)」モデルも紹介します。畳み込み埋め込みを自己注意機構とコードタイトルガイド注意機構で接続し、文並び替えに基づくデータ拡張と確率的重み平均訓練を組み合わせることで、RACは新しい最先端(SOTA)を確立し、現行最高のMacro-F1スコアに対して18.7%大幅に上回り、人間レベルのコーディング基準を超える結果を得ました。この新たなマイルストーンは、機械が医療コード予測において人間のコーダーと同等以上の性能を持つ完全自律型医療コーディング(AMC)への意味深い一歩となることを示しています。