HyperAIHyperAI

Command Palette

Search for a command to run...

vor 3 Monaten

Robuste Entitäts-Auflösung von Benennungen im Text

{Gerhard Weikum Stefan Thater Bilyana Taneva Marc Spaniol Manfred Pinkal Hagen Fürstenau Ilaria Bordino Mohamed Amir Yosef Johannes Hoffart}

Robuste Entitäts-Auflösung von Benennungen im Text

Abstract

Die Entschärfung von benannten Entitäten in natürlicher Sprache ordnet Erwähnungen mehrdeutiger Namen kanonischen Entitäten wie Personen oder Orten zu, die in einer Wissensbasis wie DBpedia oder YAGO registriert sind. In diesem Artikel wird eine robuste Methode für die kollektive Entschärfung vorgestellt, die Kontextinformationen aus Wissensbasen nutzt und einen neuen Typ von Kohärenzgraphen einsetzt. Die Methode integriert frühere Ansätze in einen umfassenden Rahmen, der drei Maßstäbe kombiniert: die a-priori-Wahrscheinlichkeit, dass eine Entität erwähnt wird, die Ähnlichkeit zwischen dem Kontext einer Erwähnung und dem Kontext eines Kandidatenentitäten sowie die Kohärenz unter allen Kandidatenentitäten für alle Erwähnungen gemeinsam. Das Verfahren konstruiert einen gewichteten Graphen aus Erwähnungen und Kandidatenentitäten und berechnet einen dichten Teilgraphen, der die optimale gemeinsame Zuordnung von Erwähnungen zu Entitäten approximiert. Experimente zeigen, dass die neue Methode im Hinblick auf die Genauigkeit signifikant gegenüber vorherigen Ansätzen abschneidet und dabei eine robuste Leistung über eine Vielzahl unterschiedlicher Eingabedaten hinweg erzielt.

Benchmarks

BenchmarkMethodikMetriken
entity-disambiguation-on-aida-conllHoffart et al.
In-KB Accuracy: 82.29
entity-linking-on-aida-conllHoffart et al. (2011)
Micro-F1 strong: 72.8

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Robuste Entitäts-Auflösung von Benennungen im Text | Forschungsarbeiten | HyperAI