Analyse de sentiment par capsules
Dans cet article, nous proposons RNN-Capsule, un modèle à capsules basé sur les réseaux de neurones récurrents (RNN) pour l'analyse d'opinion. Pour un problème donné, une capsule est construite pour chaque catégorie d'opinion, par exemple « positive » ou « négative ». Chaque capsule possède un attribut, un état et trois modules : un module de représentation, un module de probabilité et un module de reconstruction. L’attribut d’une capsule correspond à la catégorie d’opinion associée. Étant donné une instance encodée sous forme de vecteurs cachés par un RNN classique, le module de représentation construit la représentation de la capsule à l’aide d’un mécanisme d’attention. À partir de cette représentation, le module de probabilité calcule la probabilité d’état de la capsule. L’état d’une capsule est actif si sa probabilité d’état est la plus élevée parmi toutes les capsules pour l’instance donnée, et inactif dans le cas contraire. Sur deux jeux de données de référence (à savoir Movie Review et Stanford Sentiment Treebank) ainsi qu’un jeu de données propriétaires (Hospital Feedback), nous démontrons que RNN-Capsule atteint des performances de pointe dans la classification d’opinion. Plus important encore, sans recourir à aucune connaissance linguistique, RNN-Capsule est capable de produire des mots aux tendances émotionnelles reflétant les attributs des capsules. Ces mots mettent clairement en évidence la spécificité du domaine du jeu de données.