HyperAIHyperAI
vor 2 Monaten

Verbesserung der Verständnis von klinischen Dokumenten in COVID-19-Forschung mit Spark NLP

Veysel Kocaman; David Talby
Verbesserung der Verständnis von klinischen Dokumenten in COVID-19-Forschung mit Spark NLP
Abstract

Im Anschluss an die globale COVID-19-Pandemie ist die Anzahl wissenschaftlicher Arbeiten, die das Virus untersuchen, massiv angewachsen, was das Interesse an automatisierten Literaturreviews erhöht hat. Wir präsentieren ein klinisches Textmining-System, das sich in drei Aspekten von früheren Ansätzen verbessert. Erstens kann es über 100 verschiedene Entitätstypen erkennen, darunter soziale Gesundheitsbestimmungsfaktoren, Anatomie, Risikofaktoren und Nebenwirkungen, sowie andere häufig verwendete klinische und biomedizinische Entitäten. Zweitens umfasst der Textverarbeitungsprozess die Erkennung des Behauptungsstatus, um zwischen klinischen Fakten zu differenzieren, die vorhanden sind, fehlen, bedingt sind oder sich auf jemand anderen als den Patienten beziehen. Drittens sind die verwendeten Deep-Learning-Modelle genauer als bisher verfügbare Modelle; sie nutzen eine integrierte Pipeline aus state-of-the-art vorab trainierten Named-Entity-Erkennungsmodellen und verbessern die bisher besten Benchmarks für die Erkennung des Behauptungsstatus. Wir veranschaulichen das Extrahieren von Trends und Erkenntnissen aus dem COVID-19 Open Research Dataset (CORD-19), wie z.B. häufigste Störungen und Symptome sowie häufigste Vitalzeichen und EKG-Befunde. Das System wurde mit der Spark NLP-Bibliothek entwickelt, die native Unterstützung für Skalierung zur Nutzung verteilter Cluster bietet, GPUs nutzt, konfigurierbare und wiederverwendbare NLP-Pipelines unterstützt, gesundheitsspezifische Vektoreinbettungen bereitstellt und es ermöglicht, Modelle ohne Codeänderungen zu trainieren, um neue Entitätstypen oder menschliche Sprachen zu unterstützen.

Verbesserung der Verständnis von klinischen Dokumenten in COVID-19-Forschung mit Spark NLP | Neueste Forschungsarbeiten | HyperAI