HyperAIHyperAI
il y a 11 jours

Analyse arborescente de constituants N-aires par modèle semi-marovien récursif

{Zeqi Tan, Jinlong Li, Xin Xin}
Analyse arborescente de constituants N-aires par modèle semi-marovien récursif
Résumé

Dans cet article, nous étudions la tâche de parsing constituante basé sur les graphes dans un cadre où la binarisation n’est pas effectuée comme étape préalable, ce qui permet aux arbres constituants de contenir des nœuds ayant plus de deux enfants. Les méthodes précédentes basées sur les graphes dans ce cadre génèrent habituellement des nœuds cachés étiquetés par une étiquette fantôme à l’intérieur des nœuds n-aires, afin de transformer l’arbre en un arbre binaire pour la prédiction. Cette approche présente une limitation majeure : les nœuds cachés rompent les relations de fratrie entre les enfants du nœud n-aire. Par conséquent, les dépendances entre ces constituants frères ne sont pas correctement modélisées et sont souvent ignorées. Pour surmonter cette limitation, nous proposons un nouveau cadre basé sur les graphes, appelé « modèle semi-Markovien récursif ». L’idée principale consiste à utiliser un modèle semi-Markovien d’ordre 1 pour prédire la séquence immédiate des enfants d’un candidat constituante, qui sert ensuite récursivement comme candidat enfant de son parent. Ainsi, les dépendances entre constituants frères peuvent être capturées par des caractéristiques de transition d’ordre 1, résolvant efficacement la limitation précédente. Des expériences montrent que le cadre proposé atteint un score F1 de 95,92 % et 92,50 % respectivement sur les jeux de données PTB et CTB 5.1. En particulier, le modèle semi-Markovien récursif présente un avantage significatif dans la modélisation des nœuds ayant plus de deux enfants, avec une amélioration moyenne du score F1 de 0,3 à 1,1 points sur PTB et de 2,3 à 6,8 points sur CTB 5.1.

Analyse arborescente de constituants N-aires par modèle semi-marovien récursif | Articles de recherche récents | HyperAI