Höherstufige Koreferenzauflösung mit grob-zu-feinem Inferenzverfahren

Wir stellen eine vollständig differenzierbare Approximation zur höheren Inferenz für die Coreference-Resolution vor. Unser Ansatz verwendet die Antezedentenverteilung aus einer Spannungs-Rangarchitektur als Aufmerksamkeitsmechanismus, um die Spannungsrepräsentationen iterativ zu verfeinern. Dies ermöglicht es dem Modell, mehrere Schritte in den vorhergesagten Clustern sanft zu berücksichtigen. Um die Rechenkosten dieses iterativen Prozesses zu reduzieren, führen wir einen grob-zu-feinen Ansatz ein, der einen weniger genauen, aber effizienteren bilinearen Faktor integriert. Dies ermöglicht eine aggressivere Reduzierung ohne die Genauigkeit zu beeinträchtigen. Im Vergleich zum aktuellen Stand der Technik in Form des Spannungs-Rangansatzes verbessert unser Modell die Genauigkeit auf dem englischen OntoNotes-Benchmark erheblich und ist gleichzeitig viel rechnerisch effizienter.