Résumé d'Opinions Attribuable et Évolutif

Nous proposons une méthode de résumé d'opinions non supervisée qui encode les phrases des avis clients dans un espace latent discret hiérarchique, puis identifie les opinions communes en fonction de la fréquence de leurs encodages. Nous sommes capables de générer à la fois des résumés abstraits en décryptant ces encodages fréquents, et des résumés extractifs en sélectionnant les phrases attribuées aux mêmes encodages fréquents. Notre méthode est explicative, car le modèle identifie les phrases utilisées pour générer le résumé comme faisant partie du processus de résumation. Elle s'étend facilement à plusieurs centaines d'avis d'entrée, car l'agrégation est effectuée dans l'espace latent plutôt que sur de longues séquences de jetons. Nous démontrons également que notre approche permet un certain degré de contrôle, générant des résumés spécifiques à un aspect en restreignant le modèle à des parties de l'espace d'encodage correspondant aux aspects souhaités (par exemple, emplacement ou nourriture). Une évaluation automatique et humaine sur deux jeux de données issus de domaines différents montre que notre méthode génère des résumés plus informatifs que les travaux antérieurs et mieux ancrés dans les avis d'entrée.