Erkundung neuronaler Methoden zur Analyse von Diskursrepräsentationsstrukturen

Neuronale Methoden haben in der semantischen Analyse in letzter Zeit mehrere Erfolge verzeichnet, obwohl sie sich dem Herausforderung der Erzeugung von Bedeutungsrepräsentationen basierend auf formaler Semantik noch nicht gestellt haben. Wir präsentieren einen sequenzbasierten neuronalen semantischen Parser, der in der Lage ist, Diskursrepräsentationsstrukturen (DRSs) für englische Sätze mit hoher Genauigkeit zu erzeugen und dabei traditionelle DRS-Parsers zu übertreffen. Um das Lernen des Outputs zu erleichtern, stellen wir DRSs als eine Folge flacher Klauseln dar und führen eine Methode ein, um sicherzustellen, dass die erzeugten DRSs wohlgeformt und interpretierbar sind. Wir vergleichen Modelle, die Zeichen und Wörter als Eingabe verwenden, und feststellen (etwas überraschenderweise), dass die erstgenannten besser abschneiden als die letzteren. Wir zeigen, dass die Eliminierung von Variablennamen im Output durch den Einsatz von De-Bruijn-Indizes die Parser-Leistung erhöht. Die Hinzufügung von Silber-Trainingsdaten verbessert die Leistung noch weiter.