Points forts de la revue : l'analyse d'opinion sur les avis : un modèle hybride pour la sélection de règles dans l'extraction d'aspects
Cet article propose une méthodologie visant à extraire des informations clés à partir d’avis générés par les utilisateurs. Ce travail s’appuie sur l’analyse de sentiment basée sur les aspects (Aspect Based Sentiment Analysis, ABSA), une technique qui prédit l’opinion associée à des aspects mentionnés dans des documents textuels. Les aspects extraits sont d’un niveau de granularité fin, adaptés à une forme de présentation connue sous le nom de « Résumés d’avis » (Review Highlights).L’approche syntaxique traditionnelle utilisée pour l’extraction souffre de règles de découpage chevauchantes, entraînant une extraction bruitée. Nous introduisons une technique hybride combinant un modèle d’apprentissage automatique et une approche basée sur des règles. Un classificateur multi-étiquettes identifie les règles les plus pertinentes, permettant une extraction efficace des aspects et des opinions à partir des textes. Cette sélection de règles permet de réduire significativement le bruit dans les tâches d’extraction.Il s’agit d’une approche novatrice visant à apprendre la pertinence des règles syntaxiques à partir d’un corpus à l’aide de l’apprentissage automatique, afin d’assurer une extraction d’aspects précise. Étant donné que le modèle apprend à prédire les règles syntaxiques à partir d’un corpus, la méthode d’extraction devient indépendante du domaine. Elle permet également d’étudier la qualité des règles syntaxiques dans des corpus différents.