ELDEN: Verbesserte Entitätsverknüpfung mithilfe verdichteter Wissensgraphen

Entity Linking (EL)-Systeme zielen darauf ab, Erwähnungen einer Entität in Texten automatisch der entsprechenden Entität in einem Wissensgraphen (KG) zuzuordnen. Das Maß der Vernetzung einer Entität im KG beeinflusst direkt die Fähigkeit eines EL-Systems, Texterwähnungen korrekt mit Entitäten im KG zu verknüpfen. Dies führt dazu, dass viele EL-Systeme für gut vernetzte Entitäten im KG gut abschneiden, wodurch die Bedeutung der Dichte des Wissensgraphen im Kontext von EL in den Fokus rückt. In diesem Artikel stellen wir ELDEN (Entity Linking using Densified Knowledge Graphs) vor. ELDEN ist ein EL-System, das zunächst den Wissensgraphen durch Co-Occurrenz-Statistiken aus einer großen Textkorpus-Datenmenge verdichtet und anschließend den verdichteten KG nutzt, um Entitäts-Embeddings zu trainieren. Die Ähnlichkeit von Entitäten, gemessen anhand dieser trainierten Entitäts-Embeddings, führt zu einer verbesserten Leistung des Entity Linking. ELDEN übertrifft state-of-the-art EL-Systeme auf Standard-Datensätzen. Durch diese Verdichtung erzielt ELDEN auch für spärlich vernetzte Entitäten im KG eine hohe Leistung. Der Ansatz von ELDEN ist einfach, jedoch äußerst wirksam. Wir haben den Quellcode und die Daten von ELDEN öffentlich zugänglich gemacht.