il y a 2 mois
Analyse de dépendance non supervisée : Utilisons des analyseurs supervisés
Phong Le; Willem Zuidema

Résumé
Nous présentons une approche d'auto-entraînement pour l'analyse syntaxique non supervisée qui réutilise des algorithmes d'analyse syntaxique supervisés et non supervisés existants. Notre méthode, appelée « itération de reclassement » (IR), commence par des arbres de dépendance générés par un analyseur non supervisé, puis améliore itérativement ces arbres en utilisant les modèles probabilistes plus riches employés dans l'analyse syntaxique supervisée, qui sont à leur tour entraînés sur ces arbres. Notre système atteint une précision de 1,8 % supérieure à celle du meilleur analyseur actuel proposé par Spitkovsky et al. (2013) sur le corpus WSJ.