HyperAIHyperAI
vor 16 Tagen

Tiefes Darstellungslernen zur individuellen Behandlungseffektabschätzung unter Verwendung elektronischer Gesundheitsdaten

{Zhengxing Huang, Kunlun He, Uzay Kaymak, Xudong, Wei Dong, Peipei Chen}
Abstract

Die Schätzung individueller Behandlungseffekte (ITE) auf Basis klinischer Beobachtungsdaten stellt eine herausfordernde Aufgabe dar, da in solchen Daten stets eine Verzerrung durch Konfunderung vorliegt. Die meisten bestehenden Modelle zur ITE-Schätzung adressieren dieses Problem, indem sie verzerrungsfreie Schätzer für Behandlungseffekte konstruieren. Obwohl diese Ansätze wertvoll sind, steht das Lernen einer ausgewogenen Darstellung manchmal im Widerspruch zum Ziel, ein effektives und diskriminatives Modell für die ITE-Schätzung zu erlernen. Wir schlagen ein neuartiges hybrides Modell vor, das Multi-Task-Deep-Learning mit dem K-Nächste-Nachbarn-Verfahren (KNN) verbindet, um ITE zu schätzen. Genauer gesagt nutzt das vorgeschlagene Modell zunächst Multi-Task-Deep-Learning, um sowohl ausgangsprognostische als auch behandlungsbezogene latente Darstellungen aus elektronischen Gesundheitsakten (EHR) zu extrahieren, indem gleichzeitig die Ausgangsprognose und die Klassifikation der Behandlungsgruppe gemeinsam durchgeführt werden. Anschließend schätzen wir gegenfaktische Ausgänge mittels KNN auf Basis der gelernten versteckten Darstellungen. Wir validieren das vorgeschlagene Modell an einem weit verbreiteten halb-simulierten Datensatz (IHDP) sowie an einem realweltbasierten klinischen Datensatz mit 736 Patienten mit Herzinsuffizienz (HF). Die Leistung unseres Modells bleibt robust und erreicht auf dem IHDP-Datensatz eine Precision in der Schätzung heterogener Effekte (PEHE) von 1,7 und einen durchschnittlichen Behandlungseffekt (ATE) von 0,23. Auf dem HF-Datensatz erzielt das Modell eine Genauigkeit von 0,703 und einen F1-Score von 0,796. Die Ergebnisse zeigen, dass das vorgeschlagene Modell eine konkurrenzfähige Leistung im Vergleich zu aktuellen State-of-the-Art-Modellen erzielt. Zudem deuten die Ergebnisse auf mehrere Erkenntnisse hin, die mit bestehendem medizinischem Fachwissen konsistent sind, und identifizieren bestimmte suggestive Hypothesen, die durch weitere klinische Untersuchungen validiert werden könnten.