Rethinking Attribute Representation and Injection for Sentiment Classification Überdenken der Attributdarstellung und -injektion für die Stimmungsanalyse

Textattribute, wie Benutzer- und Produktdaten in Produktbewertungen, wurden verwendet, um die Leistung von Sentiment-Klassifikationsmodellen zu verbessern. Die gängige Methode besteht darin, sie als zusätzliche Bias-Terme im Aufmerksamkeitsmechanismus zu integrieren, wobei durch Erweiterung der Modellarchitektur noch bessere Ergebnisse erzielt werden. In dieser Arbeit zeigen wir, dass die obige Methode die wenigste effektive Art ist, Attribute darzustellen und einzubinden. Um diese Hypothese zu verifizieren, unterscheiden wir uns von früheren Modellen mit komplexen Architekturen und begrenzen unser Basismodell auf ein einfaches BiLSTM mit Aufmerksamkeitsklassifikator. Stattdessen konzentrieren wir uns darauf, wie und an welchen Stellen die Attribute im Modell integriert werden sollten. Wir schlagen vor, Attribute als chunkweise Wichtigkeitsgewichtsmatrizen darzustellen und betrachten vier Positionen im Modell (d.h., Einbettung, Kodierung, Aufmerksamkeit, Klassifikator) zur Einführung der Attribute. Experimente zeigen, dass unsere vorgeschlagene Methode erhebliche Verbesserungen gegenüber dem Standardansatz erreicht und dass der Aufmerksamkeitsmechanismus der schlechteste Ort für die Einführung von Attributen ist – was frühere Arbeiten widerlegt. Trotz der Verwendung eines einfachen Basismodells übertreffen wir auch den aktuellen Stand der Technik. Schließlich zeigen wir, dass diese Darstellungen sich gut auf andere Aufgaben übertragen lassen. Die Implementierung des Modells und die verwendeten Datensätze sind hier verfügbar: https://github.com/rktamplayo/CHIM.