SpEL: Strukturierte Vorhersage für Entitätensverknüpfung

Entitätssverknüpfung ist ein bedeutender Forschungsstrang, der sich auf die Erstellung strukturierter Daten durch das Verknüpfen von Textabschnitten mit einer Ontologie oder einem Wissensquellen fokussiert. Wir untersuchen erneut die Anwendung strukturierten Vorhersagens für Entitätssverknüpfung, bei der jedes einzelne Eingabetoken als Entität klassifiziert wird und die Token-Vorhersagen aggregiert werden. Unser System, genannt SpEL (Strukturierte Vorhersage für Entitätssverknüpfung), ist ein neuester Stand der Technik darstellendes System zur Entitätssverknüpfung, das einige neue Ideen zur Anwendung strukturierten Vorhersagens auf die Aufgabe der Entitätssverknüpfung implementiert. Diese umfassen: zwei verfeinerte Feinabstimmungsschritte; eine kontextsensitive Strategie zur Aggregation der Vorhersagen; Reduzierung des Ausgabevokabulars des Modells und; wir lösen ein häufig auftretendes Problem in Entitätssverknüpfungssystemen, bei dem es zu einem Missmatch zwischen Trainings- und Inferenz-Tokenisierung kommt. Unsere Experimente zeigen, dass wir den neuesten Stand der Technik im gängigen AIDA-Benchmark-Datensatz für die Verknüpfung von Entitäten mit Wikipedia übertreffen können. Unsere Methode zeichnet sich auch durch hohe Recheneffizienz in Bezug auf die Anzahl der Parameter und die Geschwindigkeit der Inferenz aus.