Une Approche Étonnamment Simple pour la Segmentation Sémantique à Peu de Fiches Généralisée

L'objectif de la segmentation sémantique à peu de exemples généralisée (GFSS) est de reconnaître des objets appartenant à des classes nouvelles en s'appuyant sur un faible nombre d'exemples annotés et sur un modèle préalablement entraîné sur des classes de base, qui a acquis des connaissances sur celles-ci. Contrairement à la segmentation sémantique classique à peu de exemples, la GFSS vise à classifier les pixels tant parmi les classes de base que parmi les classes nouvelles, ce qui en fait un cadre plus réaliste. Les méthodes actuelles de GFSS reposent sur diverses techniques, telles que l'usage de modules personnalisés combinés, des fonctions de perte soigneusement conçues, l'apprentissage méta ou encore l'apprentissage transductif. Toutefois, nous avons constaté qu'une règle simple et l'apprentissage supervisé standard améliorent significativement les performances de la GFSS. Dans cet article, nous proposons une méthode simple mais efficace pour la GFSS, ne faisant appel à aucune des techniques mentionnées ci-dessus. Nous démontrons également théoriquement que notre méthode préserve parfaitement les performances de segmentation du modèle sur la plupart des classes de base. À travers des expériences numériques, nous avons confirmé l'efficacité de notre approche : elle améliore les performances de segmentation des classes nouvelles dans le scénario 1-shot de 6,1 % sur le jeu de données PASCAL-$5^i$, de 4,7 % sur PASCAL-$10^i$, et de 1,0 % sur COCO-$20^i$.