Processus Gaussiens Denses pour la Segmentations en Peu d'Exemples

La segmentation en peu d'exemples est une tâche difficile de prédiction dense, consistant à segmenter une image requête nouvelle à partir d’un ensemble de supports annotés très réduit. Le problème central réside donc dans la conception d’une méthode capable d’agréger des informations détaillées provenant de l’ensemble de supports, tout en restant robuste aux grandes variations d’apparence et de contexte. À cette fin, nous proposons une méthode de segmentation en peu d’exemples fondée sur une régression par processus gaussien dense (GP). Étant donné l’ensemble de supports, notre GP dense apprend une application des caractéristiques profondes locales de l’image vers des valeurs de masque, permettant de capturer des distributions d’apparence complexes. En outre, elle fournit une approche rigoureuse pour modéliser l’incertitude, qui constitue un autre indicateur puissant pour la segmentation finale, obtenue par un décodeur CNN. Contrairement à une sortie de masque unidimensionnelle, nous exploitons davantage les capacités d’apprentissage end-to-end de notre approche afin d’apprendre un espace de sortie de haute dimension pour le GP. Notre méthode établit un nouveau record sur les benchmarks PASCAL-5$^i$ et COCO-20$^i$, réalisant une amélioration absolue de $+8,4$ mIoU dans le cadre 5-shot de COCO-20$^i$. De plus, la qualité de segmentation de notre méthode s’améliore de manière fluide avec l’augmentation de la taille de l’ensemble de supports, tout en assurant une bonne généralisation trans-données. Le code source et les modèles entraînés sont disponibles à l’adresse \url{https://github.com/joakimjohnander/dgpnet}.