ReFinED: Ein effizienter Ansatz für die end-to-end Entitätensverknüpfung mit Zero-Shot-Fähigkeit

Wir stellen ReFinED vor, ein effizientes End-to-End-Modell zur Entitätensverknüpfung, das feingranulare Entitätstypen und Entitätsbeschreibungen verwendet, um die Verknüpfung durchzuführen. Das Modell erkennt Erwähnungen, führt eine feingranulare Entitätstypisierung durch und klärt die Entitätsambiguität für alle Erwähnungen innerhalb eines Dokuments in einem einzigen Vorwärtsdurchgang. Dies macht es mehr als 60-mal schneller als wettbewerbsfähige bestehende Ansätze. ReFinED übertrifft zudem den Stand der Technik auf Standard-Datensätzen für Entitätenverknüpfung im Durchschnitt um 3,7 F1-Punkte. Das Modell ist in der Lage, sich auf große Wissensbasen wie Wikidata zu verallgemeinern (die 15-mal mehr Entitäten als Wikipedia enthält) und kann auch zero-shot-Entitätenverknüpfung durchführen. Die Kombination aus Geschwindigkeit, Genauigkeit und Skalierbarkeit macht ReFinED zu einem effektiven und kosteneffizienten System zur Extraktion von Entitäten aus webbasierten Datensätzen, bei denen das Modell erfolgreich eingesetzt wurde. Unser Code und unsere vortrainierten Modelle sind unter https://github.com/alexa/ReFinED verfügbar.