vor 17 Tagen
Transfer Learning und Satzlevel-Features für die Erkennung benannter Entitäten in Tweets
{Pius von D{\a}niken, Mark Cieliebak}

Abstract
Wir präsentieren unser System für die WNUT 2017 Herausforderung zum benannten Entitätenerkennung auf Twitter-Daten. Wir beschreiben zwei Modifikationen einer grundlegenden neuronalen Netzarchitektur für die Sequenzmarkierung. Zunächst zeigen wir, wie wir zusätzliche gelabelte Daten nutzen, bei denen die benannten Entitätentags von denen der Zielaufgabe abweichen. Anschließend schlagen wir eine Methode zur Einbeziehung satzweiter Merkmale vor. Unser System kombiniert beide Ansätze und erreichte beim Annotationstyp Entitätsebene den zweiten Platz mit einem F1-Score von 40,78 sowie beim Annotationstyp Oberflächenform den zweiten Platz mit einem F1-Score von 39,33.