Ein Erwähnungs-Rangiermodell für die Auflösung abstrakter Anaphern

Die Auflösung abstrakter Anaphern ist eine wichtige, aber schwierige Aufgabe für die Textverarbeitung. Dennoch wird diese Aufgabe durch jüngste Fortschritte im Bereich des Repräsentationslernens zunehmend greifbarer. Eine zentrale Eigenschaft abstrakter Anaphern besteht darin, dass sie eine Beziehung zwischen dem in der anaphorischen Satz eingebetteten Anaphor und dessen (in der Regel nicht nominalen) Antezedens herstellen. Wir schlagen ein Erwähnungs-Rangiermodell vor, das lernt, wie abstrakte Anaphern mit ihren Antezedensen in Verbindung stehen, mithilfe eines LSTM-Siamese-Netzes. Um den Mangel an Trainingsdaten zu überwinden, generieren wir künstliche anaphorische Satz-Antezedens-Paare. Unser Modell erzielt bessere Ergebnisse als der aktuelle Stand der Technik bei der Auflösung von Shell-Nomen. Zudem berichten wir über erste Benchmark-Ergebnisse auf einem Subset abstrakter Anaphern des ARRAU-Korporus. Dieser Korpus stellt eine größere Herausforderung dar aufgrund einer Mischung aus nominalen und pronominalen Anaphern sowie einer größeren Vielfalt an Störfaktoren. Wir fanden Modellvarianten, die die Baselines für nominale Anaphern übertreffen, ohne auf individuellen Anaphoren-Daten trainiert worden zu sein, jedoch noch immer hinterher hinken bei pronominalen Anaphern. Unser Modell wählt syntaktisch plausibele Kandidaten aus und diskriminiert Kandidaten unter Verwendung tieferer Merkmale, falls die Syntax außer Acht gelassen wird.