Apprentissage efficace des attributs relatifs à l’aide de réseaux neuronaux de graphes

Un corpus important de travaux sur les attributs relatifs fournit des preuves convaincantes selon lesquelles la comparaison de paires d’images le long d’un continuum de force lié à un attribut visuel conduit à des améliorations significatives dans une large variété de tâches en vision par ordinateur. Dans cet article, nous montrons comment les idées émergentes en réseaux neuronaux de graphes (GNN) peuvent offrir une solution unifiée à divers problèmes relevant de l’apprentissage d’attributs relatifs. Notre idée principale repose sur la constatation que l’apprentissage d’attributs relatifs bénéficie naturellement de l’exploitation de la structure graphique des dépendances entre différents attributs relatifs des images, en particulier lorsque seules des relations d’ordre partielles sont fournies dans les données d’entraînement. Nous utilisons un passage de messages sur un modèle graphique probabiliste afin d’effectuer un apprentissage end-to-end des représentations appropriées des images, de leurs relations mutuelles ainsi que de l’interaction entre les différents attributs, dans le but de s’aligner au mieux avec les annotations disponibles. Nos expériences démontrent que ce cadre d’apprentissage end-to-end simple basé sur les GNN est très efficace pour atteindre une précision compétitive par rapport aux méthodes spécialisées tant pour l’apprentissage d’attributs relatifs que pour la prédiction d’attributs binaires, tout en réduisant de manière significative les contraintes imposées aux données d’entraînement et/ou au nombre de paramètres, voire aux deux simultanément.