SRL4ORL: Verbesserung der Meinungsrollenbeschriftung durch mehrfache Aufgabenlernen mit semantischer Rollenbeschriftung

Seit über einem Jahrzehnt wird maschinelles Lernen zur Extraktion von Meinungsträger-Ziel-Strukturen aus Texten genutzt, um die Frage „Wer hat welche Art von Sentiment gegenüber was geäußert?“ zu beantworten. Neuere neuronale Ansätze übertreffen die derzeit besten, auf Merkmalen basierenden Modelle für die Meinungsrolle-Kennzeichnung (Opinion Role Labeling, ORL) nicht. Wir vermuten, dass dies auf den Mangel an gekennzeichneten Trainingsdaten zurückzuführen ist, und adressieren dieses Problem durch den Einsatz verschiedener Multi-Task-Lernverfahren (Multi-Task Learning, MTL) in Verbindung mit einer verwandten Aufgabe, die erheblich mehr Daten bietet, nämlich der semantischen Rollen-Kennzeichnung (Semantic Role Labeling, SRL). Wir zeigen, dass zwei MTL-Modelle bei der Kennzeichnung sowohl von Meinungsträgern als auch Zielen erhebliche Verbesserungen gegenüber dem Einzel-Aufgaben-Modell auf den Entwicklungs- und Testsets erreichen. Es stellte sich heraus, dass das einfache MTL-Modell, das nur gemeinsame ORL- und SRL-Merkmale zur Vorhersage verwendet, die besten Ergebnisse liefert. Durch eine detailliertere Analyse bestimmen wir, welche Ansätze erfolgreich sind und welche Maßnahmen möglicherweise ergriffen werden könnten, um weitere Verbesserungen für ORL zu erzielen.