Maschinenlernbasierte Lösungen für drei Phasen der klinischen Informationsextraktion: Der Stand der Technik beim i2b2 2010
Zielsetzung: Da die klinische Textmining-Technologie weiterhin reift, wird ihr Potenzial als enabler-Technologie für Innovationen im Bereich der Patientenversorgung und klinischen Forschung zunehmend real. Ein entscheidender Bestandteil dieses Prozesses ist die strenge Benchmark-Validierung von Natural-Language-Processing-Methoden an realistischen klinischen Berichten. In diesem Artikel beschreiben die Autoren die Gestaltung und Leistungsfähigkeit dreier modernster Textmining-Anwendungen des National Research Council of Canada, die im Rahmen der i2b2-Challenge 2010 evaluiert wurden.Entwurf: Die drei Systeme führen drei zentrale Schritte der klinischen Informationsextraktion durch: (1) Extraktion medizinischer Probleme, Untersuchungen und Behandlungen aus Entlassungsberichten und Fortschrittsnotizen; (2) Klassifizierung von Aussagen bezüglich medizinischer Probleme; (3) Klassifizierung von Beziehungen zwischen medizinischen Konzepten. Maschinelles Lernen wurde für diese Aufgaben eingesetzt, wobei große, hochdimensionale Merkmalsvektoren verwendet wurden, die sowohl aus dem Text selbst als auch aus externen Quellen – UMLS, cTAKES und Medline – abgeleitet wurden.Messungen: Die Leistung wurde pro Teilaufgabe anhand mikro-averagierter F-Scores gemessen, die durch den Vergleich der Systemannotationen mit den ground-truth-Annotationen auf einem Testdatensatz berechnet wurden.Ergebnisse: Die Systeme erreichten unter allen eingereichten Lösungen hohe Platzierungen im Wettbewerb, mit folgenden F-Scores: Konzeptextraktion 0,8523 (Platz 1); Aussagenerkennung 0,9362 (Platz 1); Beziehungserkennung 0,7313 (Platz 2).Schlussfolgerung: Für alle Aufgaben zeigte sich, dass die Einbeziehung einer breiten Palette von Merkmalen entscheidend für den Erfolg war. Wichtig ist, dass unsere Wahl der maschinellen Lernalgorithmen uns eine hohe Flexibilität bei der Merkmalsgestaltung ermöglichte und es uns erlaubte, eine große Anzahl von Merkmalen einzuführen, ohne Überanpassung zu erleiden oder auf Rechenressourcen-Bottlenecks zu stoßen.