Kaltenstart-bewusste Benutzer- und Produkt-Aufmerksamkeit für die Stimmungsanalyse

Die Verwendung von Nutzer-/Produktinformationen in der Sentimentanalyse ist besonders wichtig, insbesondere für Nutzer/Produkte mit kaltem Start, deren Anzahl an Bewertungen sehr begrenzt ist. Aktuelle Modelle behandeln jedoch das Problem des kalten Starts, das typisch für Bewertungswebseiten ist, nicht ausreichend. In dieser Arbeit stellen wir den Hybrid Contextualized Sentiment Classifier (HCSC) vor, der zwei Module umfasst: (1) einen schnellen Wortencoder, der Wortvektoren mit Merkmalen kurzer und langer Abhängigkeiten erzeugt; und (2) Cold-Start Aware Attention (CSAA), ein Aufmerksamkeitsmechanismus, der die Existenz des Problems des kalten Starts berücksichtigt, wenn die kodierten Wortvektoren aufmerksam gepoolt werden. Der HCSC führt geteilte Vektoren ein, die aus ähnlichen Nutzern/Produkten konstruiert werden und verwendet werden, wenn die ursprünglichen eindeutigen Vektoren nicht genügend Informationen enthalten (d.h. kalter Start). Dies wird durch ein frequenzgesteuertes selektives Gattervektor entschieden. Unsere Experimente zeigen, dass der HCSC hinsichtlich des RMSE signifikant bessere Ergebnisse liefert als bekannte Datensätze, obwohl er weniger komplex ist und daher viel schneller trainiert werden kann. Vor allem aber übertrifft unser Modell frühere Modelle bei dünn besetzten Trainingsdaten und Problemen des kalten Starts erheblich.