Extraction d’aspects non supervisée ridiculement simple

Nous présentons une méthode simple mais efficace pour l'identification des aspects dans l'analyse de sentiments. Notre méthode non supervisée ne nécessite que des plongements de mots (word embeddings) et un étiqueteur morphosyntaxique (POS tagger), ce qui la rend facile à appliquer à de nouveaux domaines et langues. Nous introduisons le mécanisme d'attention contrastive (CAt), une nouvelle attention mono-tête basée sur un noyau RBF, qui apporte une amélioration considérable des performances et rend le modèle interprétable. Les travaux précédents s'appuyaient sur des caractéristiques syntaxiques et des modèles neuronaux complexes. Nous démontrons que, compte tenu de la simplicité des ensembles de données actuels utilisés comme référence pour l'extraction d'aspects, de tels modèles complexes ne sont pas nécessaires. Le code permettant de reproduire les expériences rapportées dans cet article est disponible à l'adresse suivante : https://github.com/clips/cat