Ein Ensemble-CNN-Verfahren zur Normalisierung biomedizinischer Entitäten

Verschiedene Darstellungsformen desselben Konzepts sind in wissenschaftlichen Berichten und Publikationen häufig zu beobachten. Die Entitätennormalisierung (auch Entitätsverknüpfung genannt) ist die Aufgabe, die unterschiedlichen Darstellungsformen den entsprechenden Standardkonzepten zuzuordnen. In diesem Artikel präsentieren wir eine zweistufige Ensemble-CNN-Methode, die Mikrobiologie-bezogene Entitäten in freitextlichen Dokumenten auf Konzepte in Standardwörterbüchern normalisiert. Die Methode ist in der Lage, Entitäten zu verknüpfen, selbst wenn nur ein kleiner, mikrobiologiebezogener biomedizinischer Korpus für das Training zur Verfügung steht, und erzielte eine zufriedenstellende Leistung im Online-Test der BioNLP-OST19-Shared-Task Bacteria Biotope.