FocusCut : Plongée dans une vue centrée en segmentation interactive

La segmentation d’images interactive est un outil essentiel pour l’annotation au niveau des pixels et pour l’édition d’images. Afin d’obtenir un masque de segmentation binaire de haute précision, les utilisateurs ont tendance à ajouter des clics d’interaction autour des détails de l’objet, tels que les contours ou les trous, afin d’affiner efficacement le résultat. Les méthodes actuelles considèrent ces clics de correction comme une guidance pour déterminer conjointement la prédiction globale. Toutefois, cette vision globale fait perdre au modèle toute focalisation sur les clics ultérieurs, ce qui est contraire aux intentions de l’utilisateur. Dans cet article, nous adoptons une perspective nouvelle en explorant le point de vue des clics, afin de restaurer leur rôle décisif dans la précision des détails de l’objet. Pour vérifier la nécessité d’une vision focalisée, nous proposons une pipeline simple mais efficace, nommée FocusCut, qui intègre les fonctions de segmentation d’objet et de raffinement local. Après avoir obtenu une prédiction globale, FocusCut extrait des patches centrés sur les clics à partir de l’image d’origine, avec des tailles adaptatives, afin de raffiner progressivement les prédictions locales. Sans nécessiter de perception supplémentaire de l’utilisateur ni d’augmentation des paramètres, notre méthode atteint des résultats de pointe. Des expériences étendues et des résultats visuels démontrent que FocusCut rend possible une segmentation hyper-fine dans le cadre de la segmentation interactive d’images.