Netzwerk mit mehrfacher Aufmerksamkeit für die Aspekt-orientierte Sentiment-Klassifikation

Wir schlagen ein neuartiges Multi-Grain-Attention-Netzwerk (MGAN) für die Aspekt-orientierte Sentiment-Klassifikation vor. Bestehende Ansätze nutzen überwiegend eine grobgranuläre Aufmerksamkeitsmechanik, die bei Aspekten mit mehreren Wörtern oder umfangreicheren Kontexten zu Informationsverlust führen kann. Wir stellen eine feingranuläre Aufmerksamkeitsmechanik vor, die die Wort-ebene Interaktion zwischen Aspekt und Kontext erfassen kann. Anschließend kombinieren wir die fein- und grobgranuläre Aufmerksamkeitsmechanik zu einem MGAN-Framework. Darüber hinaus unterscheiden wir uns von früheren Arbeiten, die jeweils jeden Aspekt getrennt mit seinem Kontext trainieren, indem wir eine Aspekt-Ausrichtungsverlustfunktion entwerfen, um die aspekt-übergreifenden Interaktionen zwischen Aspekten mit gleichem Kontext zu modellieren. Wir evaluieren den vorgeschlagenen Ansatz an drei Datensätzen: Laptop und Restaurant stammen aus SemEval 2014, der dritte Datensatz ist ein Twitter-Datensatz. Experimentelle Ergebnisse zeigen, dass das Multi-Grain-Attention-Netzwerk auf allen drei Datensätzen konsistent die aktuell besten Methoden übertrifft. Zudem führen wir Experimente zur Bewertung der Wirksamkeit der Aspekt-Ausrichtungsverlustfunktion durch, die belegen, dass aspekt-übergreifende Interaktionen zusätzliche nützliche Informationen liefern und die Leistung weiter verbessern können.