SRL4ORL : Amélioration de l'étiquetage des rôles d'opinion grâce à l'apprentissage multi-tâches avec l'étiquetage des rôles sémantiques

Depuis plus d'une décennie, l'apprentissage automatique est utilisé pour extraire des structures opinionnaire-cible du texte afin de répondre à la question « Qui a exprimé quel type de sentiment envers quoi ? ». Les approches neuronales récentes ne surpassent pas les modèles basés sur les caractéristiques d'avant-garde pour l'Étiquetage des Rôles d'Opinion (ORL). Nous soupçonnons que cela est dû à la rareté des données d'entraînement étiquetées et nous abordons ce problème en utilisant différentes techniques d'apprentissage multitâche (MTL) avec une tâche connexe qui dispose de beaucoup plus de données, à savoir l'Étiquetage des Rôles Sémantiques (SRL). Nous montrons que deux modèles MTL améliorent significativement le modèle mono-tâche pour l'étiquetage des opinionnaires et des cibles, tant sur l'ensemble de développement que sur l'ensemble de test. Nous avons constaté que le modèle MTL simple qui effectue des prédictions en utilisant uniquement les caractéristiques partagées ORL et SRL donne les meilleurs résultats. Avec une analyse plus approfondie, nous déterminons ce qui fonctionne et ce qui pourrait être fait pour apporter des améliorations supplémentaires à l'ORL.