HyperAIHyperAI
vor 3 Monaten

Skalierbare, genaue Erkennung klinischer und biomedizinischer Named Entities

{David, Veysel; Talby, Kocaman}
Skalierbare, genaue Erkennung klinischer und biomedizinischer Named Entities
Abstract

Wir stellen einen agilen, produktionsreifen Algorithmus für die Named Entity Recognition (NER) im klinischen und biomedizinischen Bereich vor, der auf einer modifizierten BiLSTM-CNN-Char-Deep-Learning-Architektur basiert und auf Apache Spark aufgebaut ist. Unsere NER-Implementierung erreicht neue State-of-the-Art-Genauigkeiten auf sieben von acht bekannten biomedizinischen NER-Benchmarks sowie auf drei Herausforderungen zur klinischen Konzeptextraktion: dem 2010 i2b2/VA-Konzeptextraktions-Wettbewerb, dem 2014 n2c2-De-Identification-Wettbewerb und dem 2018 n2c2-Medikamentenextraktions-Wettbewerb. Darüber hinaus übertrifft die Genauigkeit klinischer NER-Modelle, die mit dieser Implementierung trainiert wurden, die Leistung kommerzieller Entitätsextraktionslösungen – AWS Medical Comprehend und Google Cloud Healthcare API – deutlich (um 8,9 % bzw. 6,7 %), ohne dabei speicherintensive Sprachmodelle einzusetzen.