HyperAIHyperAI
vor 18 Tagen

Stimmungsklassifikation mithilfe von Dokumenten-Embeddings, die mit Kosinus-Ähnlichkeit trainiert wurden

{Tan Thongtan, Tanasanee Phienthrakul}
Stimmungsklassifikation mithilfe von Dokumenten-Embeddings, die mit Kosinus-Ähnlichkeit trainiert wurden
Abstract

Bei der Dokument-Level-Sentiment-Klassifikation muss jedes Dokument einem Vektor fester Länge zugeordnet werden. Dokument-Embedding-Modelle projizieren jedes Dokument in einen dichten, niedrigdimensionalen Vektor im kontinuierlichen Vektorraum. In diesem Beitrag wird vorgeschlagen, Dokument-Embeddings anstelle des Skalarprodukts mittels Kosinus-Ähnlichkeit zu trainieren. Experimente auf dem IMDB-Datensatz zeigen, dass die Genauigkeit durch die Verwendung der Kosinus-Ähnlichkeit gegenüber dem Skalarprodukt verbessert wird. Zudem erreicht die Kombination von Merkmalen mit einem Naive-Bayes-gewichteten Bag-of-n-grams eine neue State-of-the-Art-Genauigkeit von 97,42 %. Der Quellcode zur Reproduktion aller Experimente ist unter https://github.com/tanthongtan/dv-cosine verfügbar.