Réexamen de la modélisation du contexte 3D avec un pré-entraînement supervisé pour la détection universelle des lésions dans les tranches de TDM

La détection universelle des lésions à partir de tranches d'imagerie par tomographie computée (CT) est cruciale pour un dépistage complet des maladies. Étant donné que chaque lésion peut se situer sur plusieurs tranches adjacentes, la modélisation du contexte 3D revêt une grande importance pour le développement d'algorithmes automatisés de détection des lésions. Dans cette étude, nous proposons un réseau de pyramide de caractéristiques pseudo-3D modifié (MP3D FPN) qui utilise des filtres de convolution séparables en profondeur et un module de transformation par groupes (GTM) pour extraire efficacement des caractéristiques 2D enrichies par le contexte 3D pour la détection universelle des lésions dans les tranches CT. Pour faciliter une convergence plus rapide, une nouvelle méthode de pré-entraînement de réseau 3D est dérivée en utilisant uniquement un grand ensemble de données d'annotation d'objets 2D dans le domaine des images naturelles. Nous montrons que, grâce à cette nouvelle méthode de pré-entraînement, le MP3D FPN proposé atteint des performances de détection de pointe sur le jeu de données DeepLesion (amélioration absolue de 3,48 % en sensibilité pour FPs@0,5), surpassant considérablement la méthode de base qui utilise la convolution 2D pour la modélisation du contexte 3D, avec une amélioration allant jusqu'à 6,06 % (en MAP@0,5). De plus, les poids pré-entraînés 3D proposés peuvent potentiellement être utilisés pour améliorer les performances d'autres tâches d'analyse d'images médicales 3D.