HyperAIHyperAI

Command Palette

Search for a command to run...

Übersetzung: Kreuzsprachige Entitätsausrichtung mit zufälliger Aufsicht

Muhao Chen Weijia Shi Ben Zhou Dan Roth

Zusammenfassung

Ein erheblicher Forschungsaufwand wurde in multilinguale Wissensgraphen-Embedding-Methoden gesteckt, um die Aufgabe der Entitätsausrichtung zu lösen, bei der Entitäten in unterschiedlichen sprachspezifischen Wissensgraphen miteinander verknüpft werden sollen, die auf dasselbe reale Objekt verweisen. Solche Methoden sind oft durch die Unzulänglichkeit der bereitgestellten Seed-Ausrichtungen zwischen den Wissensgraphen beeinträchtigt. Daher stellen wir ein zufällig überwachtes Modell, JEANS, vor, das multilinguale Wissensgraphen und Textkorpora gemeinsam in einem geteilten Embedding-Schema darstellt und die Entitätsausrichtung durch zufällige Überwachungssignale aus Texten verbessert. JEANS führt zunächst einen Entitätsgrundlegungsprozess durch, um jeden Wissensgraphen mit dem monolingualen Textkorpus zu verbinden. Anschließend werden zwei Lernprozesse durchgeführt: (i) ein Embedding-Lernprozess, der den Wissensgraphen und den Text jeder Sprache in einen gemeinsamen Embedding-Raum kodiert, und (ii) ein selbstlernendes Ausrichtungs-Lernverfahren, das iterativ die Übereinstimmung von Entitäten und Lexemen zwischen den Embeddings herstellt. Experimente auf Benchmark-Datensätzen zeigen, dass JEANS eine vielversprechende Verbesserung der Entitätsausrichtung bei zufälliger Überwachung erreicht und signifikant bessere Ergebnisse liefert als aktuelle State-of-the-Art-Methoden, die ausschließlich auf internen Informationen der Wissensgraphen basieren.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp