Un Défi Ouvert pour la Prédiction de Liens Inductifs sur les Graphes de Connaissances

Une tendance émergente dans l'apprentissage de représentations sur les graphes de connaissances (GCs) va au-delà des tâches de prédiction de liens transductives sur un ensemble fixe d'entités connues, en faveur de tâches inductives qui impliquent une formation sur un graphe et une inférence sur un nouveau graphe avec des entités inconnues. Dans les configurations inductives, les caractéristiques des nœuds sont souvent indisponibles et la formation de matrices d'embeddings d'entités peu profondes est dépourvue de sens, car elles ne peuvent pas être utilisées lors de l'inférence avec des entités inconnues. Malgré l'intérêt croissant, il existe peu de bancs d'essai pour évaluer les méthodes d'apprentissage de représentations inductives. Dans ce travail, nous présentons ILPC 2022, un nouveau défi ouvert sur la prédiction inductive de liens dans les graphes de connaissances. À cette fin, nous avons construit deux nouveaux jeux de données basés sur Wikidata, avec des tailles variées de graphes d'entraînement et d'inférence qui sont beaucoup plus importants que ceux des benchmarks inductifs existants. Nous fournissons également deux lignes directrices solides s'appuyant sur des méthodes inductives récemment proposées. Nous espérons que ce défi contribuera à harmoniser les efforts de la communauté dans le domaine de l'apprentissage inductif de représentations graphiques. ILPC 2022 suit les meilleures pratiques en matière d'équité évaluative et de reproductibilité, et est disponible à l'adresse https://github.com/pykeen/ilpc2022.