Übersetzen von Embeddings zur Modellierung mehrere Relationen umfassender Daten

Wir betrachten das Problem der Einbettung von Entitäten und Relationen multi-relationaler Daten in niedrigdimensionale Vektorräume. Unser Ziel ist es, ein kanonisches Modell vorzuschlagen, das leicht zu trainieren ist, eine reduzierte Anzahl an Parametern aufweist und sich skalieren lässt, um sehr große Datenbanken zu verarbeiten. Daher schlagen wir TransE vor, eine Methode, die Relationen durch die Interpretation als Translationen auf den niedrigdimensionalen Einbettungen der Entitäten modelliert. Trotz seiner Einfachheit erweist sich diese Annahme als leistungsstark, da umfangreiche Experimente zeigen, dass TransE auf zwei Wissensbasen signifikant besser abschneidet als aktuelle State-of-the-Art-Verfahren im Bereich der Link-Vorhersage. Zudem kann das Modell erfolgreich auf einem großen Datensatz mit 1 Mio. Entitäten, 25.000 Relationen und mehr als 17 Mio. Trainingsbeispielen trainiert werden.