Histogrammes d'Orientations de Gradient Rencontrent l'Apprentissage Profond : Un Nouveau Réseau Profond Multi-tâches pour la Segmentation Sémantique d'Images Médicales

Nous présentons notre nouvelle méthode d'apprentissage profond multi-tâches pour la segmentation d'images médicales. Les méthodes multi-tâches existantes exigent des annotations de vérité terrain pour les tâches principales et auxiliaires. Contrairement à ces approches, nous proposons de générer des pseudo-étiquettes pour la tâche auxiliaire de manière non supervisée. Pour générer ces pseudo-étiquettes, nous utilisons l'Histogramme des Gradients Orientés (HOGs), l'une des caractéristiques manuellement conçues les plus largement utilisées et puissantes pour la détection. En combinant les masques de segmentation sémantique de vérité terrain pour la tâche principale et les pseudo-étiquettes pour la tâche auxiliaire, nous apprenons les paramètres du réseau profond afin de minimiser conjointement la perte des deux tâches. Nous avons appliqué notre méthode sur deux réseaux de segmentation sémantique puissants et largement utilisés : UNet et U2Net, dans un cadre multi-tâches. Pour valider notre hypothèse, nous avons mené des expériences sur deux ensembles de données différents de segmentation d'images médicales. À partir des résultats quantitatifs et qualitatifs exhaustifs, nous constatons que notre méthode améliore constamment les performances par rapport à la méthode équivalente. De plus, notre méthode a remporté le sous-défi FetReg Endovis sur la Segmentation Sémantique organisé en conjonction avec MICCAI 2021.