Réseau de transfert de graphe de connaissances pour la reconnaissance à faible exemple

L'apprentissage à très peu d'exemples vise à apprendre de nouvelles catégories à partir d'un très petit nombre d'exemples, en s'appuyant sur des catégories de base disposant d'un ensemble d'entraînement suffisamment riche. Le défi principal de cette tâche réside dans le fait que les nouvelles catégories sont susceptibles d’être dominées par des caractéristiques spécifiques telles que la couleur, le texte, la forme de l’objet ou le contexte d’arrière-plan (appelé « spécificité »), qui sont présentes dans les rares exemples d’entraînement fournis mais ne sont pas représentatives de la catégorie globale (voir la Figure 1). Heureusement, nous constatons que le transfert d’informations provenant des catégories de base corrélées peut aider à apprendre efficacement les nouveaux concepts, et ainsi éviter que ces derniers ne soient biaisés par la spécificité. En outre, l’intégration de corrélations sémantiques entre différentes catégories permet de régulariser de manière efficace ce transfert d’information. Dans ce travail, nous représentons ces corrélations sémantiques sous la forme d’un graphe de connaissances structuré, que nous intégrons dans des réseaux neuronaux profonds afin de promouvoir l’apprentissage à très peu d’exemples via un nouveau modèle appelé Réseau de Transfert de Graphe de Connaissances (KGTN). Plus précisément, en initialisant chaque nœud du graphe avec les poids du classificateur correspondant à sa catégorie, nous apprenons un mécanisme de propagation permettant de transmettre de manière adaptative les messages entre les nœuds à travers le graphe, afin d’explorer les interactions entre nœuds et de transférer les informations de classification des catégories de base vers celles des nouvelles catégories. Des expériences étendues sur le jeu de données ImageNet montrent une amélioration significative des performances par rapport aux méthodes concurrentes les plus performantes. En outre, nous avons construit un nouveau jeu de données, ImageNet-6K, couvrant un plus grand nombre de catégories — 6 000 catégories — et les expériences réalisées sur ce jeu de données renforcent davantage la validité du modèle proposé. Les codes et modèles sont disponibles à l’adresse suivante : https://github.com/MyChocer/KGTN.