Kaskadenartige Multiway-Attention für die Dokumentebene-Sentiment-Klassifikation

Die Dokument-Level-Sentiment-Klassifikation zielt darauf ab, den Sentiment-Polarität von Nutzerbewertungen zuzuordnen. Frühere Methoden berücksichtigten entweder lediglich den Dokumentinhalt, ohne Nutzer- und Produktinformationen einzubeziehen, oder betrachteten nicht umfassend, welche Rolle die drei Informationsarten im Textmodellierungsvorgang spielen. In diesem Artikel stellen wir die Idee vor, dass sowohl Nutzer-, Produkt- als auch deren Kombinationseinflüsse die Aufmerksamkeitsgenerierung auf Wort- und Satzebene beeinflussen können, wenn die Sentimentrichtung eines Dokuments beurteilt wird. Auf Basis dieser Idee entwickeln wir ein kaskadenartiges Multiway-Attention-Modell (CMA), bei dem mehrere Ansätze zur Nutzung von Nutzer- und Produktinformationen kaskadenartig miteinander verknüpft werden, um die Aufmerksamkeitsgenerierung auf Wort- und Satzebene zu beeinflussen. Anschließend werden Sätze und Dokumente durch mehrere Repräsentationsvektoren gut modelliert, die reichhaltige Informationen für die Sentiment-Klassifikation bereitstellen. Experimente an den Datensätzen IMDB und Yelp belegen die Wirksamkeit unseres Modells.