Ein transitionsbasierter Parser für gerichtete azyklische Graphen (DAG) im UCCA-Rahmen

Wir präsentieren den ersten Parser für UCCA, ein über Sprachgrenzen hinweg anwendbares Framework für die semantische Repräsentation, das auf umfangreicher typologischer Arbeit basiert und eine schnelle Annotation unterstützt. UCCA stellt eine Herausforderung für bestehende Parsing-Techniken dar, da es Reentrantität (was zu DAG-Strukturen führt), diskontinuierliche Strukturen und nichtterminale Knoten aufweist, die komplexen semantischen Einheiten entsprechen. Nach unserem Wissen wird die Kombination dieser formalen Eigenschaften von keinem existierenden Parser unterstützt. Unser transduktionsbasierter Parser, der ein neuartiges Übergangssatz und Merkmale basierend auf bidirektionalem LSTM verwendet, hat nicht nur einen Wert für das Parsen von UCCA: seine Fähigkeit, allgemeinere Graphstrukturen zu verarbeiten, kann die Entwicklung von Parsern für andere semantische DAG-Strukturen sowie für Sprachen, die häufig diskontinuierliche Strukturen verwenden, beeinflussen.