Standard-Sentiment-Datensatz Der Stanford Sentiment Treebank
Datum
Größe
Veröffentlichungs-URL
Stanford Sentiment Treebank ist ein standardmäßiger Sentiment-Datensatz, der hauptsächlich zur Sentiment-Klassifizierung verwendet wird, in dem jeder Knoten des Satzanalysebaums eine feinkörnige Sentiment-Annotation aufweist.
Der Datensatz wurde von der NLP-Gruppe der Stanford University veröffentlicht und enthält 239.232 Sätze und Phrasen. Im Vergleich zu den meisten Systemen zur Stimmungsvorhersage, die die Wortreihenfolge ignorieren, erstellt dieses Deep-Learning-Modell eine vollständige Darstellung basierend auf der Satzstruktur. Es kann Emotionen anhand von aus Wörtern zusammengesetzten Phrasen bestimmen.
Dieser Datensatz wurde 2013 von der Natural Language Processing Group der Stanford University veröffentlicht. Das zugehörige Dokument trägt den Titel „Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank“.