Inkorporation von Singletons und erwähnungsbasierter Merkmale in die Kernreferenzauflösung mittels Mehraufgabenlernen zur Verbesserung der Generalisierbarkeit

Bisherige Versuche, eine Erwähnungsdetektion in end-to-end neuronale Kernferenzauflösungsmodelle für Englisch zu integrieren, waren durch den Mangel an Singleton-Erwähnungsabschnitten sowie weiterer Entitätsinformationen behindert. In dieser Arbeit wird ein Kernferenzmodell vorgestellt, das sowohl Singleton-Erwähnungen als auch Merkmale wie Entitätstyp und Informationsstatus mittels eines mehrzielbasierten Lernansatzes erlernt. Dieser Ansatz erreicht neue Sollwertwerte auf der OntoGUM-Benchmark (+2,7 Punkte) und verbessert die Robustheit auf mehreren außerhalb des Domänenbereichs liegenden Datensätzen (durchschnittlich +2,3 Punkte), vermutlich aufgrund einer höheren Verallgemeinerungsfähigkeit der Erwähnungsdetektion sowie einer effektiveren Nutzung zusätzlicher Daten aus Singleton-Erwähnungen im Vergleich zur bloßen Paarvergleichung von kernferenzrelevanten Erwähnungen.