HyperAIHyperAI
vor 17 Tagen

WikiGUM: Ermüdende Entitätenverknüpfung für die Wikifizierung in 12 Genres

Jessica Lin, Amir Zeldes
WikiGUM: Ermüdende Entitätenverknüpfung für die Wikifizierung in 12 Genres
Abstract

Frühere Arbeiten zum Entity Linking konzentrierten sich auf Ressourcen, die auf nicht geschachtelte Eigennamenbeschränkungen abzielten, häufig anhand von Daten aus Wikipedia, also Wikifizierung. In diesem Paper stellen wir WikiGUM vor und evaluieren es: ein vollständig wikifiziertes Datensatz, der alle Erwähnungen von Eigennamen, einschließlich nicht-namhafter und pronominaler Erwähnungen sowie geschachtelter Erwähnungen innerhalb anderer Erwähnungen, abdeckt. Der Datensatz umfasst eine breite Palette von zwölf geschriebenen und gesprochenen Genres, wovon die meisten bisher in der Forschung zum Entity Linking nicht berücksichtigt wurden, was zu einer schlechten Leistung eines vortrainierten SOTA-Systems in unserer Evaluation führte. Die Verfügbarkeit weiterer Annotationen für dieselbe Datenbasis ermöglicht zudem zusätzliche Forschung zu Entitäten im Kontext.