il y a 2 mois
Tetra-Étiquetage : Analyse Syntaxique Synchronisée sur les Mots avec Inférence en Temps Linéaire
Nikita Kitaev; Dan Klein

Résumé
Nous présentons un algorithme de parsing en constituants qui, comme un supertagueur, fonctionne en attribuant des étiquettes à chaque mot d'une phrase. Pour tirer pleinement parti des architectures neuronales actuelles, le modèle évalue les étiquettes de chaque mot en parallèle, avec une structure spécifique à la tâche minimale. Après l'évaluation, une phase de réconciliation de gauche à droite extrait un arbre en temps linéaire (empiriquement). Notre analyseur obtient un score F1 de 95,4 sur l'ensemble de test du WSJ tout en réalisant des accélérations considérables par rapport aux analyseurs les plus performants actuellement disponibles, avec des précisions comparables.