Priorité de la Tightness de la Boîte de Délimitation pour le Segmentation d'Images Faiblement Supervisée

Ce document présente une méthode de segmentation d'images faiblement supervisée qui adopte des annotations de boîtes englobantes serrées. Il propose une généralisation de l'apprentissage par instances multiples (MIL) et une approximation lisse du maximum pour intégrer le priori de la serrure des boîtes englobantes dans le réseau neuronal profond de manière end-to-end. Dans la généralisation du MIL, les sacs positifs sont définis par des lignes parallèles croisées avec un ensemble d'angles différents, tandis que les sacs négatifs sont définis comme des pixels individuels situés en dehors de toute boîte englobante. Deux variantes d'approximation lisse du maximum, à savoir la fonction $α$-softmax et la fonction $α$-quasimax, sont utilisées pour surmonter l'instabilité numérique introduite par la fonction maximum de prédiction des sacs. L'approche proposée a été évaluée sur deux jeux de données médicales publics en utilisant le coefficient Dice. Les résultats montrent qu'elle surpassent les méthodes les plus avancées actuellement disponibles. Le code source est disponible à l'adresse \url{https://github.com/wangjuan313/wsis-boundingbox}.