BB_twtr bei SemEval-2017 Task 4: Twitter-Sentimentanalyse mit CNNs und LSTMs

In dieser Arbeit beschreiben wir unseren Versuch, einen state-of-the-art Sentiment-Klassifikator für Twitter-Nachrichten zu entwickeln, indem wir Convolutional Neural Networks (CNNs) und Long Short-Term Memory (LSTMs)-Netzwerke einsetzen. Unser System nutzt eine große Menge an nicht gekennzeichneten Daten, um Wort-Vektoren vorzutrainieren. Anschließend verwenden wir einen Teil der nicht gekennzeichneten Daten, um die Vektoren durch distante Überwachung weiter zu optimieren. Die endgültigen CNNs und LSTMs werden auf dem SemEval-2017 Twitter-Datensatz trainiert, wobei die Vektoren erneut verfeinert werden. Um die Leistung zu verbessern, kombinieren wir mehrere CNNs und LSTMs. Unser Ansatz erreichte den ersten Platz in allen fünf englischen Teilaufgaben unter 40 Teams.