HyperAIHyperAI
vor 17 Tagen

Identifikation seltener Krankheiten aus klinischen Notizen mittels Ontologien und schwacher Supervision

Hang Dong, Víctor Suárez-Paniagua, Huayu Zhang, Minhong Wang, Emma Whitfield, Honghan Wu
Identifikation seltener Krankheiten aus klinischen Notizen mittels Ontologien und schwacher Supervision
Abstract

Die Identifizierung seltener Erkrankungen aus klinischen Notizen mittels Natural Language Processing (NLP) ist aufgrund der geringen Anzahl verfügbarer Fälle für maschinelles Lernen und des Bedarfs an Datenannotierung durch klinische Experten herausfordernd. Wir stellen eine Methode vor, die auf Ontologien und Weak Supervision basiert. Der Ansatz gliedert sich in zwei Schritte: (i) Text-to-UMLS, bei dem Texterwähnungen mit Konzepten im Unified Medical Language System (UMLS) verknüpft werden, unter Verwendung eines Named-Entity-Linking-Tools (z. B. SemEHR) sowie Weak Supervision basierend auf maßgeschneiderten Regeln und kontextuellen Repräsentationen, die auf Bidirectional Encoder Representations from Transformers (BERT) beruhen, und (ii) UMLS-to-ORDO, bei dem UMLS-Konzepte mit seltenen Erkrankungen in der Orphanet Rare Disease Ontology (ORDO) abgeglichen werden. Anhand von Fallstudien an den US-amerikanischen Entlassungsberichten aus der Intensivstation der MIMIC-III-Datenbank zeigen wir, dass der Text-to-UMLS-Prozess erheblich durch Weak Supervision verbessert werden kann, ohne dass annotierte Daten von fachkundigen Experten erforderlich sind. Unsere Analyse ergibt, dass der gesamte Prozess zur Verarbeitung von Entlassungsberichten seltene Erkrankungsfälle aufdecken kann, die in der Regel in den manuell vergebenen ICD-Codes der Krankenhausaufnahmen nicht erfasst sind.

Identifikation seltener Krankheiten aus klinischen Notizen mittels Ontologien und schwacher Supervision | Neueste Forschungsarbeiten | HyperAI