Analyse en Grammaire de Structure Phrasale Dirigée par la Tête sur le Penn Treebank

La grammaire de structure phrasale dirigée par la tête (HPSG) bénéficie d'une formalisation uniforme représentant des significations syntaxiques et sémantiques riches et contextuelles. Cet article fait une première tentative pour formuler une HPSG simplifiée en intégrant les représentations formelles des constituants et des dépendances dans la structure phrasale dirigée par la tête. Deux algorithmes de parsing sont ensuite proposés pour deux représentations arborescentes converties, à savoir l'espacement de division et l'espacement conjoint (division span et joint span). Comme l'HPSG encode à la fois les informations sur la structure des constituants et celle sur la structure des dépendances, les parseurs HPSG proposés peuvent être considérés comme un type de décodeur conjoint pour ces deux types de structures et sont donc évalués en termes d'arbres de parsing extraits ou convertis, tant pour les constituants que pour les dépendances. Notre parseur atteint de nouvelles performances de pointe pour les deux tâches de parsing sur le Penn Treebank (PTB) et le Chinese Penn Treebank, confirmant ainsi l'efficacité de l'apprentissage conjoint des structures de constituants et de dépendances. Plus précisément, nous rapportons un score F1 de 96,33 % pour le parsing des constituants et un taux UAS (Unlabeled Attachment Score) de 97,20 % pour le parsing des dépendances sur le PTB.