CorefQA: Coreferenzauflösung als abfragbasierte Spannvorhersage
CorefQA: Coreferenzauflösung als abfragbasierte Spannvorhersage
{Fei Wu Fei Wang Wei Wu Jiwei Li Arianna Yuan}

Abstract
In diesem Artikel präsentieren wir CorefQA, einen genauen und erweiterbaren Ansatz für die Coreferenzauflösung. Wir formulieren das Problem als Spann-Vorhersage-Aufgabe, ähnlich wie bei der Fragebeantwortung: Für jede Kandidat-Erwähnung wird mithilfe ihres umgebenden Kontexts eine Abfrage generiert, und ein Spann-Vorhersagemodul wird eingesetzt, um die Textspans der Coreferenzen innerhalb des Dokuments anhand der generierten Abfrage zu extrahieren. Diese Formulierung bietet folgende zentrale Vorteile: (1) Die Spann-Vorhersage-Strategie ermöglicht die Flexibilität, Erwähnungen zu erfassen, die im Stadium der Erwähnungsvorschläge übersehen wurden; (2) Im Rahmen der Fragebeantwortung erlaubt die explizite Kodierung von Erwähnung und Kontext in einer Abfrage eine tiefe und gründliche Analyse der Hinweise, die im Kontext der coreferenten Erwähnungen enthalten sind; und (3) Eine Vielzahl bereits bestehender Fragebeantwortungs-Datensätze kann zur Datenverstärkung genutzt werden, um die Generalisierungsfähigkeit des Modells zu verbessern. Experimente zeigen eine signifikante Leistungssteigerung gegenüber früheren Modellen, mit einem F1-Score von 83,1 (+3,5) auf dem CoNLL-2012-Benchmark und 87,5 (+2,5) auf dem GAP-Benchmark.
Code-Repositories
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| coreference-resolution-on-conll-2012 | CorefQA + SpanBERT-base | Avg F1: 79.9 |
| coreference-resolution-on-conll-2012 | CorefQA + SpanBERT-large | Avg F1: 83.1 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.