Automatisierte medizinische Kodierung in MIMIC-III und MIMIC-IV: Eine kritische Übersicht und Reproduzierbarkeitsstudie

Die medizinische Kodierung ist die Aufgabe, medizinische Codes klinischen freitextlichen Dokumentationen zuzuweisen. Gesundheitsfachkräfte weisen solche Codes manuell zu, um Patientendiagnosen und -behandlungen zu verfolgen. Automatisierte medizinische Kodierung kann diese administrative Last erheblich reduzieren. In dieser Arbeit reproduzieren, vergleichen und analysieren wir standesübliche automatisierte medizinische Kodierungsmodelle des maschinellen Lernens. Wir zeigen, dass mehrere Modelle aufgrund schwacher Konfigurationen, schlecht gewählter Trainings-Test-Spalten und unzureichender Evaluierung unterdurchschnittlich performen. In früheren Arbeiten wurde der Makro-F1-Wert suboptimal berechnet; unsere Korrektur verdoppelt diesen Wert. Wir leisten einen überarbeiteten Modellvergleich unter Verwendung von geschichteter Stichprobenziehung und identischen Versuchsaufbauten, einschließlich Hyperparameter-Optimierung und Anpassung der Entscheidungsgrenzen. Wir analysieren Vorhersagefehler, um Annahmen früherer Arbeiten zu bestätigen oder zu widerlegen. Die Analyse bestätigt, dass alle Modelle mit seltenen Codes Schwierigkeiten haben, während lange Dokumente nur einen vernachlässigbaren Einfluss haben. Schließlich präsentieren wir die ersten umfassenden Ergebnisse am neu veröffentlichten MIMIC-IV-Datensatz unter Verwendung der reproduzierten Modelle. Wir veröffentlichen unseren Code, die Modellparameter sowie neue Trainings- und Evaluierungs-Pipelines für MIMIC-III und MIMIC-IV, um faire Vergleiche in Zukunft zu ermöglichen.