Verbesserung der Entitätendesambiguierung durch Schließen über eine Wissensbasis

Neuere Arbeiten im Bereich der Entitätserkennung (Entity Disambiguation, ED) haben in der Regel strukturierte Wissensbasis-Informationen (structured knowledge base facts, KB-Fakten) vernachlässigt und stattdessen auf eine begrenzte Teilmenge von Wissensbasisinformationen wie Entitätsbeschreibungen oder -typen zurückgegriffen. Dies beschränkt den Kontext, in dem Entitäten eindeutig zugeordnet werden können. Um die Verwendung aller KB-Fakten zu ermöglichen, einschließlich Beschreibungen und Typen, stellen wir ein ED-Modell vor, das Entitäten durch die differenzierbare Verarbeitung einer symbolischen Wissensbasis verknüpft. Unser Modell übertrifft sechs etablierte ED-Datensätze durchschnittlich um 1,3 F1 im Vergleich zu den besten bisherigen Ansätzen. Durch die Möglichkeit, auf alle KB-Informationen zuzugreifen, ist unser Modell weniger abhängig von popularitätsbasierten Entitätsvorwahrscheinlichkeiten und verbessert die Leistung auf dem anspruchsvollen ShadowLink-Datensatz (der sich auf seltene und mehrdeutige Entitäten konzentriert) um 12,7 F1.