Extraction d'entités d'intérêt à partir de critiques comparatives de produits

Ce document présente une approche basée sur l'apprentissage profond pour extraire des informations de comparaison de produits à partir d'avis d'utilisateurs sur divers sites de commerce électronique. Toute revue comparative de produits comporte trois entités d'information principales : les noms des produits comparés, l'opinion de l'utilisateur (prédicat) et la caractéristique ou l'aspect en cours de comparaison. Toutes ces entités informatives sont interdépendantes et liées par les règles linguistiques dans la revue. Nous constatons que leurs interdépendances peuvent être bien capturées à l'aide de réseaux LSTM (Long Short-Term Memory). Nous évaluons notre système sur des jeux de données existants manuellement étiquetés et observons une performance supérieure au cadre SRL (Semantic Role Labeling) couramment utilisé pour cette tâche.