mgsohrab bei WNUT 2020 Shared Task-1: Neuronale erschöpfende Herangehensweise zur Entitäten- und Relationserkennung in nassen Laborprotokollen

Wir präsentieren einen neuronalen erschöpfenden Ansatz, der die Erkennung benannter Entitäten (Named Entity Recognition, NER) und die Relationserkennung (Relation Recognition, RE) adressiert, im Rahmen der gemeinsamen Aufgabe zur Entität- und Relationserkennung in Laborprotokollen (wet-lab protocols shared task). Wir führen einen auf BERT basierenden neuronalen erschöpfenden Ansatz ein, der alle möglichen Textabschnitte als potenzielle Entitätsmentionen aufzählt und diese mittels tiefer neuronalen Netze in Entitätstypen oder keine Entität klassifiziert, um die NER-Aufgabe zu lösen. Zur Lösung der Relationsextraktion verwenden wir auf den NER-Vorhersagen oder gegebenen Gold-Mentionen basierend alle möglichen Trigger-Argument-Paare, die anschließend in Relationstypen oder keine Relation klassifiziert werden. Bei der NER-Aufgabe erzielten wir einen F-Score von 76,60 % und belegten damit den dritten Platz unter den teilnehmenden Systemen. Bei der Relationsextraktion erreichten wir einen F-Score von 80,46 % und waren damit das führende System in der Relationsextraktion oder -erkennungsaufgabe. Zudem vergleichen wir unser Modell auf Basis der wet-lab protocols-Korpus (WLPC) mit dem WLPC-Baseline sowie den dynamischen graphbasierten Informationsextraktions-Systemen (DyGIE).