InferNER: ein aufmerksames Modell, das informationsreiche Satzebene für die Erkennung benannter Entitäten in Microblogs nutzt
Wir untersuchen das Problem der Namensentitätserkennung (Named Entity Recognition, NER) in nutzergenerierten Texten, wie beispielsweise Beiträgen in sozialen Medien. Diese Aufgabe ist besonders herausfordernd aufgrund der begrenzten Länge und der eingeschränkten grammatikalischen Kohärenz dieser Datentypen. Aktuelle state-of-the-art-Ansätze greifen hierbei auf externe Quellen wie Gazetteer zurück, um einige dieser Einschränkungen zu mildern. Wir präsentieren ein neuronales Modell, das die derzeitige State-of-the-Art-Leistung bei dieser Aufgabe erreicht – ohne auf Gazetteer oder ähnliche externe Informationsquellen zurückzugreifen. Unser Ansatz basiert auf der Nutzung von Informationen auf Wort-, Zeichen- und Satzebene für die NER in Kurztexten. Soziale Medien-Beiträge wie Tweets sind oft mit Bildern verbunden, die zusätzlichen Kontext liefern können, der zur besseren Verständnis dieser Texte beiträgt. Daher integrieren wir auch visuelle Informationen und führen eine Aufmerksamkeitskomponente ein, die getrennt Aufmerksamkeitsgewichte für textuelle und textrelevanten visuelle Kontext berechnet. Unser Modell übertrifft die aktuelle State-of-the-Art-Leistung auf mehreren NER-Datensätzen. Auf den Datensätzen WNUT 2016 und 2017 erzielte unser Modell jeweils F1-Scores von 53,48 % und 50,52 %. Mit dem multimodalen Modell erreicht unser System zudem eine F1-Score von 74 % auf dem multimodalen Datensatz und übertrifft damit die derzeitige State-of-the-Art. Unsere Evaluation deutet zudem darauf hin, dass unser Modell auch auf Newswire-Daten über die aktuelle State-of-the-Art hinausgeht, was seine Eignung für verschiedene NER-Aufgaben unterstreicht.