Ein bidirektionales Baumtagging-Verfahren für die gemeinsame Extraktion medizinischer Beziehungen

Die gemeinsame medizinische Relationsextraktion bezieht sich auf das Extrahieren von Tripeln, die aus Entitäten und Relationen bestehen, aus medizinischen Texten mit einem einzelnen Modell. Eine der Lösungen besteht darin, diese Aufgabe in eine sequenzielle Tagging-Aufgabe umzuwandeln. Allerdings scheiterten in bisherigen Arbeiten die Methoden zur linearen Darstellung und Kennzeichnung der Tripel an überlappenden Tripeln, während die Ansätze zur Graphorganisation der Tripel vor der Herausforderung standen, einen hohen Rechenaufwand zu bewältigen. In dieser Arbeit schlagen wir ein neues Verfahren vor, das als bidirektionales Baumtagging (BiTT) bezeichnet wird. Es dient dazu, medizinische Relationstripel in zwei binäre Bäume zu strukturieren und diese Bäume in eine Wort-Level-Tags-Sequenz zu konvertieren. Basierend auf dem BiTT-Verfahren entwickeln wir ein Modell zur gemeinsamen Relationsextraktion, das die BiTT-Tags vorhersagt und die medizinischen Tripel effizient extrahiert. Unser Modell erzielt auf zwei medizinischen Datensätzen eine Verbesserung um 2,0 % und 2,5 % im F1-Score im Vergleich zu den besten Baselines. Darüber hinaus erzielen Modelle mit unserem BiTT-Verfahren auch vielversprechende Ergebnisse in drei öffentlichen Datensätzen anderer Bereiche.