Medizinische Codes Vorhersage aus Entlassungszusammenfassung: Dokument zu Sequenz BERT unter Verwendung von Sequenz-Attention

Klinische Notizen sind unstrukturierte Texte, die von Klinikern während der Patientenbegegnungen erstellt werden. Diese Notizen werden in der Regel mit einem Satz von Metadaten-Codes aus der International Classification of Diseases (ICD) ergänzt. Der ICD-Code ist ein wichtiger Code, der in verschiedenen Operationen, einschließlich Versicherung, Erstattung und medizinischer Diagnose, verwendet wird. Daher ist es entscheidend, ICD-Codes schnell und präzise zu klassifizieren. Die Annotation dieser Codes ist jedoch kostspielig und zeitaufwendig. Wir schlagen daher ein Modell vor, das auf bidirektionellen Encoder-Repräsentationen von Transformatoren (BERT) basiert und die sequentielle Aufmerksamkeitsmethode zur automatischen Zuordnung von ICD-Codes verwendet. Unser Ansatz wurde am Benchmark-Datensatz Medical Information Mart for Intensive Care III (MIMIC-III) evaluiert. Unser Modell erzielte eine Makro-F1-Wertung von 0,62898 und eine Mikro-F1-Wertung von 0,68555 und übertrifft damit die Leistung des aktuellen besten Modells bei Verwendung des MIMIC-III-Datensatzes. Der Beitrag dieser Studie besteht darin, eine Methode zur Verwendung von BERT vorzuschlagen, die auf Dokumente angewendet werden kann, sowie eine sequentielle Aufmerksamkeitsmethode, die wichtige sequenzielle Informationen in Dokumenten erfassen kann.