HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Analyse arborescente de constituants N-aires par modèle semi-marovien récursif

{Zeqi Tan Jinlong Li Xin Xin}

Analyse arborescente de constituants N-aires par modèle semi-marovien récursif

Résumé

Dans cet article, nous étudions la tâche de parsing constituante basé sur les graphes dans un cadre où la binarisation n’est pas effectuée comme étape préalable, ce qui permet aux arbres constituants de contenir des nœuds ayant plus de deux enfants. Les méthodes précédentes basées sur les graphes dans ce cadre génèrent habituellement des nœuds cachés étiquetés par une étiquette fantôme à l’intérieur des nœuds n-aires, afin de transformer l’arbre en un arbre binaire pour la prédiction. Cette approche présente une limitation majeure : les nœuds cachés rompent les relations de fratrie entre les enfants du nœud n-aire. Par conséquent, les dépendances entre ces constituants frères ne sont pas correctement modélisées et sont souvent ignorées. Pour surmonter cette limitation, nous proposons un nouveau cadre basé sur les graphes, appelé « modèle semi-Markovien récursif ». L’idée principale consiste à utiliser un modèle semi-Markovien d’ordre 1 pour prédire la séquence immédiate des enfants d’un candidat constituante, qui sert ensuite récursivement comme candidat enfant de son parent. Ainsi, les dépendances entre constituants frères peuvent être capturées par des caractéristiques de transition d’ordre 1, résolvant efficacement la limitation précédente. Des expériences montrent que le cadre proposé atteint un score F1 de 95,92 % et 92,50 % respectivement sur les jeux de données PTB et CTB 5.1. En particulier, le modèle semi-Markovien récursif présente un avantage significatif dans la modélisation des nœuds ayant plus de deux enfants, avec une amélioration moyenne du score F1 de 0,3 à 1,1 points sur PTB et de 2,3 à 6,8 points sur CTB 5.1.

Benchmarks

BenchmarkMéthodologieMétriques
constituency-parsing-on-ctb5N-ary semi-markov + BERT
F1 score: 92.50
constituency-parsing-on-penn-treebankN-ary semi-markov + BERT-large
F1 score: 95.92

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp