HyperAIHyperAI
il y a 11 jours

Traduction des embeddings pour la modélisation des données multi-relationnelles

{Alberto Garcia-Duran, Nicolas Usunier, Jason Weston, Oksana Yakhnenko, Antoine Bordes}
Traduction des embeddings pour la modélisation des données multi-relationnelles
Résumé

Nous considérons le problème d’embedding des entités et des relations dans des espaces vectoriels à faible dimension à partir de données multi-relationnelles. Notre objectif est de proposer un modèle canonique facile à entraîner, comportant un nombre réduit de paramètres et capable de s’échelonner à de très grandes bases de données. Ainsi, nous proposons TransE, une méthode qui modélise les relations en les interprétant comme des translations agissant sur les embeddings à faible dimension des entités. Malgré sa simplicité, cette hypothèse s’avère particulièrement puissante, puisque des expérimentations étendues montrent que TransE surpasse significativement les méthodes de pointe en prédiction de liens sur deux bases de connaissances. De plus, ce modèle peut être efficacement entraîné sur un jeu de données à grande échelle comprenant 1 million d’entités, 25 000 relations et plus de 17 millions d’échantillons d’apprentissage.

Traduction des embeddings pour la modélisation des données multi-relationnelles | Articles de recherche récents | HyperAI