Guidage multi-niveau conscient du contenu pour la segmentation d'instances interactive

Dans la segmentation d'instances interactive, les utilisateurs fournissent des retours itératifs afin d'affiner progressivement les masques de segmentation. Les clics fournis par l'utilisateur sont transformés en cartes de guidance qui fournissent au réseau des indices essentiels concernant la localisation de l'objet d'intérêt. Les cartes de guidance utilisées dans les systèmes actuels sont fondamentalement basées sur la distance et sont soit trop localisées, soit peu informatives. Nous proposons une nouvelle transformation des clics utilisateur afin de générer des cartes de guidance sensibles au contenu, exploitant les informations structurelles hiérarchiques présentes dans une image. Grâce à nos cartes de guidance, même les réseaux FCN les plus simples parviennent à surpasser les approches existantes qui requièrent des réseaux de segmentation d'avant-garde pré-entraînés sur de grandes bases de données de segmentation. Nous démontrons l'efficacité de notre stratégie de transformation par des expérimentations approfondies, au cours desquelles nous améliorons significativement l'état de l'art sur quatre benchmarks standard de segmentation interactive.