Amélioration de la classification d'opinion au niveau du document en utilisant l'importance des phrases

Les chercheurs précédents ont envisagé l’analyse d’opinion comme une tâche de classification de documents, dans laquelle les documents d’entrée sont classifiés selon des catégories d’opinion prédéfinies. Bien que certains énoncés d’un document apportent des éléments de preuve importants pour l’analyse d’opinion, tandis que d’autres n’en apportent pas, ces travaux ont traité le document comme un « sac de phrases », sans tenir compte de l’importance respective de chaque phrase. En d’autres termes, ils n’ont pas pris en compte le degré de pertinence de chaque phrase dans le document. Pour déterminer efficacement la polarité d’un document, chaque phrase devrait être traitée avec un degré d’importance différent. Afin de résoudre ce problème, nous proposons un modèle de classification de phrases au niveau du document basé sur les réseaux de neurones profonds, dans lequel les degrés d’importance des phrases dans un document sont automatiquement déterminés grâce à des mécanismes de porte. Pour valider notre nouveau modèle d’analyse d’opinion, nous avons mené des expériences sur des jeux de données d’opinion provenant de quatre domaines distincts : critiques de films, critiques d’hôtels, critiques de restaurants et critiques de musique. Les résultats expérimentaux montrent que le modèle proposé surpassait les modèles de pointe précédents, qui ne prenaient pas en compte les différences d’importance entre les phrases d’un document. Ces résultats confirment que l’importance des phrases doit être prise en compte dans les tâches de classification d’opinion au niveau du document.