HyperAIHyperAI
vor 9 Tagen

Ein neuer öffentlicher Korpus für die Identifikation klinischer Abschnitte: MedSecId

{Cornelia Caragea, Barbara Di Eugenio, Adam Webb, Sean S. Huang, Kunal Patel, Paul Landes}
Ein neuer öffentlicher Korpus für die Identifikation klinischer Abschnitte: MedSecId
Abstract

Der Prozess der Abgrenzung und Kennzeichnung von Abschnitten in einem Dokument wird als Abschnittsidentifikation bezeichnet. Solche Abschnitte sind für den Leser nützlich, wenn er nach Informationen sucht oder bestimmte Themen im Kontext versteht. Ziel dieser Arbeit ist die Segmentierung von Abschnitten in klinischen medizinischen Dokumenten. Der Hauptbeitrag dieser Arbeit ist MedSecId, eine öffentlich verfügbare Sammlung von 2.002 voll annotierten medizinischen Notizen aus dem MIMIC-III-Datensatz. Wir stellen mehrere Baseline-Methoden, den Quellcode, ein vortrainiertes Modell sowie eine Analyse der Daten bereit, die mithilfe der Hauptkomponentenanalyse Beziehungen zwischen medizinischen Konzepten über verschiedene Abschnitte hinweg aufzeigt.

Ein neuer öffentlicher Korpus für die Identifikation klinischer Abschnitte: MedSecId | Neueste Forschungsarbeiten | HyperAI