Übersetzung: Kreuzsprachige Entitätsausrichtung mit zufälliger Aufsicht

Ein erheblicher Forschungsaufwand wurde in multilinguale Wissensgraphen-Embedding-Methoden gesteckt, um die Aufgabe der Entitätsausrichtung zu lösen, bei der Entitäten in unterschiedlichen sprachspezifischen Wissensgraphen miteinander verknüpft werden sollen, die auf dasselbe reale Objekt verweisen. Solche Methoden sind oft durch die Unzulänglichkeit der bereitgestellten Seed-Ausrichtungen zwischen den Wissensgraphen beeinträchtigt. Daher stellen wir ein zufällig überwachtes Modell, JEANS, vor, das multilinguale Wissensgraphen und Textkorpora gemeinsam in einem geteilten Embedding-Schema darstellt und die Entitätsausrichtung durch zufällige Überwachungssignale aus Texten verbessert. JEANS führt zunächst einen Entitätsgrundlegungsprozess durch, um jeden Wissensgraphen mit dem monolingualen Textkorpus zu verbinden. Anschließend werden zwei Lernprozesse durchgeführt: (i) ein Embedding-Lernprozess, der den Wissensgraphen und den Text jeder Sprache in einen gemeinsamen Embedding-Raum kodiert, und (ii) ein selbstlernendes Ausrichtungs-Lernverfahren, das iterativ die Übereinstimmung von Entitäten und Lexemen zwischen den Embeddings herstellt. Experimente auf Benchmark-Datensätzen zeigen, dass JEANS eine vielversprechende Verbesserung der Entitätsausrichtung bei zufälliger Überwachung erreicht und signifikant bessere Ergebnisse liefert als aktuelle State-of-the-Art-Methoden, die ausschließlich auf internen Informationen der Wissensgraphen basieren.