Zur Vereinheitlichung des Etikettierungsraums für aspektbasierte und satzbasierende Sentimentanalyse

Die aspektbasierte Sentimentanalyse (Aspect-Based Sentiment Analysis, ABSA) ist eine fein granulierte Aufgabe, die darauf abzielt, die Sentimentpolarität gegenüber spezifischen Aspektbegriffen in einem Satz zu bestimmen. Die Entwicklung der ABSA-Aufgabe ist stark durch den Mangel an annotierten Daten behindert. Um diesem Problem entgegenzuwirken, haben frühere Arbeiten die Möglichkeit untersucht, Sentimentanalyse-(SA-)Datensätze zur Unterstützung des Trainings von ABSA-Modellen heranzuziehen, vor allem mittels Vortrainings oder Multi-Task-Learning. In diesem Artikel folgen wir dieser Herangehensweise und gelingt es erstmals, die Pseudo-Label-(PL-)Methode zur Vereinigung zweier homogener Aufgaben einzusetzen. Obwohl die Verwendung von generierten Pseudolabels auf den ersten Blick eine naheliegende Lösung für die Vereinheitlichung der Label-Granularität bei zwei eng verwandten Aufgaben darstellt, identifizieren wir in dieser Arbeit deren zentrale Herausforderung und schlagen einen neuartigen Rahmen vor, den wir Dual-Granularity Pseudo Labeling (DPL) nennen. Ähnlich wie bei der PL-Methode betrachten wir DPL als einen allgemeinen Rahmen, der sich mit anderen etablierten Methoden aus der Literatur kombinieren lässt. Durch umfangreiche Experimente erreicht DPL eine state-of-the-art-Leistung auf Standardbenchmarks und übertrifft die vorherigen Ansätze signifikant.