vor 2 Monaten
Tetra-Tagging: Wortsynchrones Parsen mit linearer Inferenzzeit
Nikita Kitaev; Dan Klein

Abstract
Wir präsentieren einen Konstituenzparsingsalgorithmus, der ähnlich wie ein Supertagger durch die Zuweisung von Labels zu jedem Wort in einem Satz arbeitet. Um die aktuellen neuronalen Architekturen optimal auszunutzen, bewertet das Modell die Tags jedes Worts parallel, wobei es eine minimale aufgabenbezogene Struktur verwendet. Nach der Bewertung extrahiert eine links-rechts Ausgleichsphase den Syntaxbaum in (empirisch) linearer Zeit. Unser Parser erreicht einen F1-Score von 95,4 % auf dem WSJ-Testdatensatz und erzielt gleichzeitig erhebliche Geschwindigkeitsverbesserungen im Vergleich zu aktuellen state-of-the-art-Parsern mit vergleichbarer Genauigkeit.