FABSA: Ein aspektbasiertes Sentiment-Analyse-Datensatz benutzerbasierter Rezensionen
Aspect-basierte Sentimentanalyse (Aspect-Based Sentiment Analysis, ABSA) zielt darauf ab, Aspekte von Entitäten automatisch zu extrahieren und die Polarität jedes extrahierten Aspekts zu klassifizieren. Die Mehrheit der verfügbaren ABSA-Systeme stützt sich stark auf manuell annotierte Datensätze, um überwachte maschinelle Lernmodelle zu trainieren. Die Erstellung solcher manuell kuratierten Datensätze ist jedoch ein arbeitsintensiver Prozess, weshalb bestehende ABSA-Datensätze nur wenige Domänen abdecken und in ihrer Größe begrenzt sind. Um diesem Problem entgegenzuwirken, präsentieren wir FABSA (Feedback ABSA), einen neuen, großskaligen und mehrdomänenübergreifenden ABSA-Datensatz von Feedback-Bewertungen. FABSA umfasst etwa 10.500 Rezensionen, die sich über 10 verschiedene Domänen erstrecken. Wir führen eine Reihe von Experimenten durch, um die Leistung state-of-the-art-Deep-Learning-Modelle bei der Anwendung auf den FABSA-Datensatz zu evaluieren. Unsere Ergebnisse zeigen, dass ABSA-Modelle bei Trainierung auf unserem FABSA-Datensatz in der Lage sind, über verschiedene Domänen hinweg generalisieren, wobei sich die Modellleistung weiter verbessert, wenn ein größerer Trainingsdatensatz verwendet wird. Der FABSA-Datensatz ist öffentlich zugänglich.