HyperAIHyperAI
il y a 16 jours

RDF2Vec : Intégration de graphes RDF et applications

{Petar Ristoski, Tommaso Di Noia, Renato De Leone, Jessica Rosati, Heiko Paulheim}
RDF2Vec : Intégration de graphes RDF et applications
Résumé

Les données ouvertes liées (Linked Open Data) sont reconnues comme une source précieuse d'information contextuelle dans de nombreuses tâches d'extraction de données et de récupération d'information. Toutefois, la plupart des outils existants nécessitent des caractéristiques sous forme propositionnelle, c’est-à-dire un vecteur de caractéristiques nominales ou numériques associé à une instance, alors que les sources de données ouvertes liées sont intrinsèquement des graphes. Dans cet article, nous présentons RDF2Vec, une méthode qui s'appuie sur des approches de modélisation linguistique pour l'extraction non supervisée de caractéristiques à partir de séquences de mots, et qui les adapte aux graphes RDF. Nous générons des séquences en exploitant l'information locale provenant de sous-structures de graphe, extraite à l’aide des noyaux de sous-arbres RDF basés sur l’algorithme Weisfeiler-Lehman et des promenades aléatoires dans les graphes, afin d’apprendre des représentations numériques latentes des entités au sein des graphes RDF. Nous évaluons notre approche sur trois tâches différentes : (i) des tâches classiques d’apprentissage automatique, (ii) la modélisation d’entités et de documents, et (iii) les systèmes de recommandation basés sur le contenu. Les résultats montrent que les embeddings d’entités proposés surpassent les techniques existantes, et que les représentations vectorielles pré-calculées de caractéristiques pour des graphes de connaissance généraux tels que DBpedia et Wikidata peuvent être facilement réutilisées pour diverses tâches.

RDF2Vec : Intégration de graphes RDF et applications | Articles de recherche récents | HyperAI