Stimmungsanalyse durch Capsules
In diesem Artikel stellen wir RNN-Capsule vor, ein auf rekurrenten neuronalen Netzwerken (RNN) basierendes Kapselformat für die Sentimentanalyse. Für eine gegebene Aufgabenstellung wird jeweils eine Kapselform für jede Sentimentkategorie – beispielsweise „positiv“ und „negativ“ – konstruiert. Jede Kapselform verfügt über ein Attribut, einen Zustand sowie drei Module: das Repräsentationsmodul, das Wahrscheinlichkeitsmodul und das Rekonstruktionsmodul. Das Attribut einer Kapselform entspricht der zugewiesenen Sentimentkategorie. Gegeben eine Instanz, die durch ein typisches RNN in versteckte Vektoren kodiert wurde, erzeugt das Repräsentationsmodul die Kapselform-Repräsentation mittels eines Aufmerksamkeitsmechanismus. Auf Basis dieser Kapselform-Repräsentation berechnet das Wahrscheinlichkeitsmodul die Zustandswahrscheinlichkeit der Kapselform. Ein Zustand einer Kapselform ist aktiv, wenn seine Zustandswahrscheinlichkeit die höchste unter allen Kapselformen für die gegebene Instanz ist; andernfalls ist er inaktiv. Auf zwei Benchmark-Datensätzen (nämlich Movie Review und Stanford Sentiment Treebank) sowie einem proprietären Datensatz (Hospital Feedback) zeigen wir, dass RNN-Capsule eine state-of-the-art-Leistung bei der Sentiment-Klassifikation erzielt. Insbesondere ist RNN-Capsule in der Lage, ohne jegliche linguistische Kenntnisse Wörter mit Sentiment-Tendenzen auszugeben, die die Attribute der Kapselformen widerspiegeln. Diese Wörter reflektieren die Domänen-Spezifität des jeweiligen Datensatzes gut.