HyperAIHyperAI

Command Palette

Search for a command to run...

Ein Erwähnungs-Rangiermodell für die Auflösung abstrakter Anaphern

Ana Marasović Leo Born Juri Opitz Anette Frank

Zusammenfassung

Die Auflösung abstrakter Anaphern ist eine wichtige, aber schwierige Aufgabe für die Textverarbeitung. Dennoch wird diese Aufgabe durch jüngste Fortschritte im Bereich des Repräsentationslernens zunehmend greifbarer. Eine zentrale Eigenschaft abstrakter Anaphern besteht darin, dass sie eine Beziehung zwischen dem in der anaphorischen Satz eingebetteten Anaphor und dessen (in der Regel nicht nominalen) Antezedens herstellen. Wir schlagen ein Erwähnungs-Rangiermodell vor, das lernt, wie abstrakte Anaphern mit ihren Antezedensen in Verbindung stehen, mithilfe eines LSTM-Siamese-Netzes. Um den Mangel an Trainingsdaten zu überwinden, generieren wir künstliche anaphorische Satz-Antezedens-Paare. Unser Modell erzielt bessere Ergebnisse als der aktuelle Stand der Technik bei der Auflösung von Shell-Nomen. Zudem berichten wir über erste Benchmark-Ergebnisse auf einem Subset abstrakter Anaphern des ARRAU-Korporus. Dieser Korpus stellt eine größere Herausforderung dar aufgrund einer Mischung aus nominalen und pronominalen Anaphern sowie einer größeren Vielfalt an Störfaktoren. Wir fanden Modellvarianten, die die Baselines für nominale Anaphern übertreffen, ohne auf individuellen Anaphoren-Daten trainiert worden zu sein, jedoch noch immer hinterher hinken bei pronominalen Anaphern. Unser Modell wählt syntaktisch plausibele Kandidaten aus und diskriminiert Kandidaten unter Verwendung tieferer Merkmale, falls die Syntax außer Acht gelassen wird.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp