Semantische Rollenvergabe als Abhängigkeitsanalyse: Explorieren latenter Baumstrukturen innerhalb von Argumenten

Die semantische Rollenmarkierung (SRL) ist eine grundlegende, aber dennoch herausfordernde Aufgabe in der NLP-Gemeinschaft. Aktuelle Arbeiten im Bereich der SRL lassen sich hauptsächlich in zwei Kategorien einteilen: 1) auf BIO-basierten Ansätzen; 2) auf span-basierten Ansätzen. Trotz ihrer weit verbreiteten Anwendung weisen sie einige inhärente Nachteile auf, da sie die internen Argumentstrukturen nicht berücksichtigen, was die Ausdrucksfähigkeit des Modells potentiell einschränken könnte. Das Hauptproblem besteht darin, dass Argumente flache Strukturen sind und für Wörter innerhalb von Argumenten keine festgelegten Teilbaumrealisierungen existieren. Um dieses Problem zu beheben, schlagen wir in diesem Artikel vor, flache Argumentspannen als latente Teilbäume zu betrachten und die SRL somit in eine Baumparsing-Aufgabe umzuwandeln. Insbesondere versehen wir unsere Formulierung mit einem neuartigen span-bedingten TreeCRF (span-constrained TreeCRF), um die Baustrukturen span-bewusst zu gestalten und erweitern dies anschließend auf den zweiten Grad. Wir führen umfangreiche Experimente an den Benchmarks CoNLL05 und CoNLL12 durch. Die Ergebnisse zeigen, dass unsere Methoden deutlich besser abschneiden als alle früheren syntaktisch unabhängigen Arbeiten und neue Standarts unter sowohl den end-to-end- als auch den gold-Praedikaten-Einstellungen erreichen.