Head-Driven Phrase Structure Grammar Parsing auf dem Penn Treebank

Die head-driven phrase structure grammar (HPSG) zeichnet sich durch eine einheitliche Formalisierung aus, die reiche kontextuelle syntaktische und sogar semantische Bedeutungen darstellen kann. In dieser Arbeit wird erstmals ein vereinfachtes HPSG entwickelt, indem konstituierende und abhängigkeitsbasierte Formalisierungen in die head-driven Phrase-Struktur integriert werden. Anschließend werden zwei Parsing-Algorithmen für die beiden umgewandelten Baumrepräsentationen, Divisionspanne und Jointspanne, vorgeschlagen. Da HPSG sowohl Informationen über konstituierende als auch über abhängigkeitsbasierte Strukturen kodiert, können die vorgeschlagenen HPSG-Parsers als Art von gemeinsamen Dekodern für beide Strukturtypen angesehen werden und daher anhand der extrahierten oder umgewandelten konstituierenden und abhängigkeitsbasierten Parsing-Bäume evaluiert werden. Unser Parser erreicht neue Standesbestleistungen (state-of-the-art) bei beiden Parsing-Aufgaben im Penn Treebank (PTB) und im Chinese Penn Treebank, was die Effektivität des gemeinsamen Lernens von konstituierenden und abhängigkeitsbasierten Strukturen bestätigt. Im Detail erreichen wir einen F1-Score von 96,33 % bei der konstituierenden Parsing und eine UAS (unlabeled attachment score) von 97,20 % bei der abhängigkeitsbasierten Parsing im PTB.