Apprentissage zéro-shot à l'aide de graphes de connaissances sur le sens commun

L'apprentissage zéro-shot repose sur des représentations sémantiques de classes, telles que des attributs conçus manuellement ou des embeddings appris, afin de prédire des classes sans aucun exemple étiqueté. Nous proposons d’apprendre des représentations de classes en plongeant les nœuds de graphes de connaissances courantes dans un espace vectoriel. Les graphes de connaissances courantes constituent une source inexploitée de connaissances de haut niveau explicites, qui nécessitent peu d’effort humain pour être appliquées à une large gamme de tâches. Pour capturer cette connaissance contenue dans le graphe, nous introduisons ZSL-KG, un cadre généralisable basé sur un nouveau réseau de convolution de graphes à transformer (TrGCN) pour générer des représentations de classes. L'architecture TrGCN proposée calcule des combinaisons non linéaires des voisinages de nœuds. Nos résultats montrent que ZSL-KG surpasse les méthodes existantes basées sur WordNet sur cinq des six jeux de données standard d'apprentissage zéro-shot dans les domaines du langage et de la vision.