HyperAIHyperAI
vor 11 Tagen

Coreference-Auflösung durch ein seq2seq-basiertes Übergangssystem

Bernd Bohnet, Chris Alberti, Michael Collins
Coreference-Auflösung durch ein seq2seq-basiertes Übergangssystem
Abstract

Die meisten aktuellen Coreference-Auflösungssysteme verwenden Suchalgorithmen über mögliche Spannen, um Erwähnungen zu identifizieren und die Coreference aufzulösen. Stattdessen präsentieren wir ein Coreference-Auflösungssystem, das ein text-zu-Text-Paradigma (seq2seq) nutzt, um Erwähnungen und Verknüpfungen gemeinsam vorherzusagen. Wir implementieren das Coreference-System als Übergangssystem und verwenden multilinguales T5 als zugrundeliegendes Sprachmodell. Wir erreichen einen Stand der Technik bei den CoNLL-2012-Daten mit einem F1-Score von 83,3 für Englisch (eine Verbesserung um 2,3 gegenüber vorhergehenden Arbeiten (Dobrovolskii, 2021)), bei nur der Verwendung von CoNLL-Daten für das Training, einen F1-Score von 68,5 für Arabisch (eine Verbesserung um +4,1 gegenüber vorhergehenden Arbeiten) und einen F1-Score von 74,3 für Chinesisch (eine Verbesserung um +5,3). Zudem führen wir Experimente im Zero-Shot-, Few-Shot- und überwachten Setting mit den SemEval-2010-Datensätzen durch, wobei wir alle verfügbaren Trainingsdaten nutzen. Wir erzielen signifikant höhere Zero-Shot-F1-Scores für drei von vier Sprachen im Vergleich zu vorhergehenden Ansätzen und übertreffen die vorhergehenden überwachten State-of-the-Art-Ergebnisse für alle fünf getesteten Sprachen erheblich.

Coreference-Auflösung durch ein seq2seq-basiertes Übergangssystem | Neueste Forschungsarbeiten | HyperAI