HyperAIHyperAI
vor 2 Monaten

Ein Aufmerksamkeitsmodell für die ICD-Codierung aus klinischen Texten

Thanh Vu; Dat Quoc Nguyen; Anthony Nguyen
Ein Aufmerksamkeitsmodell für die ICD-Codierung aus klinischen Texten
Abstract

Die ICD-Kodierung ist ein Prozess, bei dem den von Gesundheitsfachkräften (wie Klinikern) dokumentierten klinischen/medizinischen Notizen die Diagnosecodes der International Classification of Diseases zugewiesen werden. Dieser Prozess erfordert erhebliche menschliche Ressourcen und ist daher kostspielig und fehleranfällig. Um dieses Problem anzugehen, wurde maschinelles Lernen zur automatischen ICD-Kodierung eingesetzt. Bislang waren die fortschrittlichsten Modelle auf konvolutorische Neuronale Netze basiert, die eine einzelne oder mehrere feste Fenstergrößen verwendeten. Allerdings variieren die Längen und Abhängigkeiten zwischen Textabschnitten, die mit ICD-Codes in klinischen Texten zusammenhängen, erheblich, was es schwierig macht, die optimalen Fenstergrößen zu bestimmen. In dieser Arbeit schlagen wir ein neues Label-Attention-Modell für die automatische ICD-Kodierung vor, das sowohl die unterschiedlichen Längen als auch die Abhängigkeiten der ICD-code-bezogenen Textabschnitte bewältigen kann. Darüber hinaus führt die Tatsache, dass die Mehrheit der ICD-Codes nicht häufig verwendet wird, zu einem stark unbalancierten Datensatzproblem. Daher schlagen wir zusätzlich einen hierarchischen Joint-Learning-Mechanismus vor, der unser Label-Attention-Modell erweitert und durch Verwendung der hierarchischen Beziehungen zwischen den Codes dieses Problem angeht. Unser Label-Attention-Modell erreicht neue Standesbestimmungen (state-of-the-art results) auf drei Benchmark-Datensätzen des MIMIC-Projekts, und der Joint-Learning-Mechanismus hilft dabei, die Leistung bei selten verwendeten Codes zu verbessern.