FECANet : Accroître la segmentation sémantique à peu de exemples grâce au réseau contextuel sensible aux caractéristiques améliorées

La segmentation sémantique à peu de exemples consiste à apprendre à localiser chaque pixel de la nouvelle classe dans une image de requête à partir de seulement quelques images de support annotées. Les méthodes actuelles basées sur la corrélation construisent des corrélations de caractéristiques par paires afin d’établir des correspondances multiples à multiples, car les approches classiques fondées sur les prototypes ne parviennent pas à apprendre des relations de correspondance fines. Toutefois, les méthodes existantes souffrent encore du bruit présent dans les corrélations naïves ainsi que du manque d’informations sémantiques contextuelles dans ces corrélations. Pour atténuer ces problèmes, nous proposons un réseau Feature-Enhanced Context-Aware Network (FECANet). Plus précisément, nous introduisons un module d’amélioration des caractéristiques visant à supprimer le bruit de correspondance dû à la similarité locale entre classes et à renforcer la pertinence intra-classe dans les corrélations naïves. En outre, nous proposons un nouveau module de reconstruction de corrélation, qui encode des relations de correspondance supplémentaires entre les régions avant-plan et arrière-plan ainsi que des caractéristiques sémantiques contextuelles à plusieurs échelles, améliorant ainsi significativement la capacité de l’encodeur à capturer un motif de correspondance fiable. Les expériences menées sur les jeux de données PASCAL-$5^i$ et COCO-$20^i$ démontrent que notre FECANet permet une amélioration notable par rapport aux méthodes de pointe précédentes, confirmant ainsi son efficacité.