Universal Dependency Parsing von Grund auf

Dieses Papier beschreibt das System der Stanford University für die CoNLL 2018 UD Gemeinschaftsaufgabe (Shared Task). Wir stellen ein vollständiges neuronales Pipeline-System vor, das rohen Text als Eingabe akzeptiert und alle von der Gemeinschaftsaufgabe geforderten Aufgaben durchführt, von der Tokenisierung und Satzsegmentierung bis hin zur Part-of-Speech-Tagging und Dependenzanalyse. Unsere Einreichung mit einem einzelnen System erzielte sehr wettbewerbsfähige Ergebnisse bei großen Treebanks. Darüber hinaus hätten wir nach Behebung eines unglücklichen Fehlers in den offiziellen Bewertungsmaßstäben LAS, MLAS und BLEX den 2., 1. und 3. Platz belegt. Unser korrigiertes System hätte zudem bei den Kategorien der ressourcenarmen Treebanks in allen Maßstäben deutlich besser abgeschnitten als alle eingereichten Systeme. Durch umfangreiche Abstrichstudien (ablation studies) zeigen wir außerdem die Effektivität verschiedener Modellkomponenten.