Deep Semantic Role Labeling : Ce qui fonctionne et ce qui reste à faire

Nous introduisons un nouveau modèle d'apprentissage profond pour l'étiquetage sémantique des rôles (SRL), qui améliore significativement l'état de l'art, accompagné d'analyses détaillées mettant en évidence ses forces et ses limites. Nous utilisons une architecture profonde à highway BiLSTM avec décodage contraint, tout en adoptant plusieurs bonnes pratiques récentes en matière d'initialisation et de régularisation. Notre modèle en ensemble de huit couches atteint un score F1 de 83,2 sur l'ensemble de test CoNLL 2005 et de 83,4 sur CoNLL 2012, soit une réduction d'environ 10 % de l'erreur relative par rapport à l'état de l'art précédent. Une analyse empirique approfondie de ces gains révèle que (1) les modèles profonds se distinguent particulièrement dans la récupération des dépendances à longue portée, bien qu'ils puissent encore commettre des erreurs surprenantes et manifestes, et (2) qu'il reste un potentiel d'amélioration pour les analyseurs syntaxiques afin de renforcer ces résultats.