Exploration d'un modèle neuronal conjoint pour la segmentation discursive au niveau des phrases et l'analyse d'opinion

La segmentation du discours et l’analyse d’opinion constituent deux tâches fondamentales en traitement automatique du langage naturel, dont on a montré qu’elles se renforcent mutuellement. Dans ce travail, nous concevons et comparons deux modèles basés sur les réseaux neuronaux pour l’apprentissage conjoint de ces deux tâches. Dans l’approche proposée, nous commençons par construire une représentation vectorielle pour tous les segments textuels présents dans la phrase d’entrée. Ensuite, nous appliquons trois modèles différents de réseaux neuronaux récursifs : l’un pour la prédiction de la structure discursive, un autre pour la prédiction des relations discursives, et un troisième pour l’analyse d’opinion. Enfin, nous combinons ces réseaux neuronaux dans deux modèles conjoints distincts : le multitâche et le pré-entraînement. Nos résultats obtenus sur deux corpus standards indiquent que les deux méthodes améliorent les performances de chaque tâche, mais que l’approche multitâche exerce un effet plus marqué que le pré-entraînement. En particulier, pour la segmentation du discours, nous observons une amélioration significative dans la prédiction de l’ensemble des relations contrastives.