Ein neuer öffentlicher Korpus für die Identifikation klinischer Abschnitte: MedSecId
{Cornelia Caragea Barbara Di Eugenio Adam Webb Sean S. Huang Kunal Patel Paul Landes}

Abstract
Der Prozess der Abgrenzung und Kennzeichnung von Abschnitten in einem Dokument wird als Abschnittsidentifikation bezeichnet. Solche Abschnitte sind für den Leser nützlich, wenn er nach Informationen sucht oder bestimmte Themen im Kontext versteht. Ziel dieser Arbeit ist die Segmentierung von Abschnitten in klinischen medizinischen Dokumenten. Der Hauptbeitrag dieser Arbeit ist MedSecId, eine öffentlich verfügbare Sammlung von 2.002 voll annotierten medizinischen Notizen aus dem MIMIC-III-Datensatz. Wir stellen mehrere Baseline-Methoden, den Quellcode, ein vortrainiertes Modell sowie eine Analyse der Daten bereit, die mithilfe der Hauptkomponentenanalyse Beziehungen zwischen medizinischen Konzepten über verschiedene Abschnitte hinweg aufzeigt.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| classification-on-medsecid | BiLSTM-CRF | 1 shot Micro-F1: 82.2 |
| clinical-section-identification-on-medsecid | MedSecId | 1 shot Micro-F1: 95.5 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.