Réseaux d'attention contextuelle par graphe pour l'appariement de graphes profonds à taille variable

L’apprentissage profond pour le correspondance de graphes a suscité un intérêt croissant et connu un développement rapide au cours de la dernière décennie. Bien que les méthodes récentes basées sur l’apprentissage profond pour la correspondance de graphes aient démontré de très bons résultats dans le domaine de la vision par ordinateur, notamment pour la correspondance entre graphes de taille égale, le problème de correspondance de graphes de tailles variables — où le nombre de points clés dans les images d’une même catégorie peut varier en raison d’occlusions — reste un défi ouvert et difficile. Pour relever ce défi, nous proposons tout d’abord de formuler le problème combinatoire de correspondance de graphes comme un problème de Programmation Linéaire en Nombres Entiers (ILP), une formulation plus flexible et efficace permettant de comparer des graphes de tailles différentes. Nous introduisons ensuite un nouveau réseau neuronal, le Graph-context Attention Network (GCAN), qui permet de capturer conjointement la structure intrinsèque du graphe et les informations inter-graphes afin d’améliorer la discrimination des caractéristiques des nœuds. Ce modèle GCAN est entraîné pour résoudre le problème ILP sous supervision de correspondance nœud-à-nœud. Nous montrons également que le modèle GCAN proposé est efficace pour résoudre le problème de correspondance au niveau du graphe, et qu’il est capable d’apprendre automatiquement la similarité nœud-à-nœud grâce à la correspondance au niveau du graphe. L’approche proposée est évaluée sur trois jeux de données publics de correspondance de points clés ainsi que sur un jeu de données de correspondance de graphes dédié aux motifs de vaisseaux sanguins. Les résultats expérimentaux démontrent que notre méthode surpasse de manière significative les algorithmes de pointe existants sur les tâches de correspondance de points clés et de correspondance au niveau du graphe.