Avancement de l'analyse d'images médicales 3D grâce à la pré-formation supervisée 3D basée sur la transformation à dimensions variables

Les difficultés liées à l'acquisition et à l'annotation des données restreignent considérablement les tailles d'échantillons des ensembles de données d'entraînement pour les applications d'imagerie médicale 3D. Par conséquent, construire des réseaux neuronaux convolutifs 3D de haute performance à partir de zéro reste une tâche ardue en l'absence de paramètres pré-entraînés suffisants. Les tentatives précédentes de pré-entraînement 3D ont souvent reposé sur des approches auto-supervisées, qui utilisent soit l'apprentissage prédictif, soit l'apprentissage contrastif sur des données non étiquetées pour construire des représentations 3D invariantes. Cependant, en raison du manque d'informations de supervision à grande échelle, obtenir des représentations sémantiquement invariantes et discriminantes à partir de ces cadres d'apprentissage reste problématique. Dans cet article, nous reprenons un cadre innovant mais simple de pré-entraînement supervisé complet pour tirer parti des supervisions sémantiques provenant de grands ensembles de données d'images naturelles 2D. Grâce à une architecture réseau 3D redessinée, les images naturelles reformulées sont utilisées pour résoudre le problème de la rareté des données et développer des représentations 3D puissantes. Des expériences exhaustives menées sur quatre ensembles de données de référence montrent que les modèles pré-entraînés proposés peuvent accélérer efficacement la convergence tout en améliorant la précision pour diverses tâches d'imagerie médicale 3D telles que la classification, la segmentation et la détection. De plus, par rapport à l'entraînement à partir de zéro, il peut économiser jusqu'à 60 % des efforts d'annotation. Sur le jeu de données NIH DeepLesion, il atteint également des performances de détection au niveau de l'état de l'art, surpassant les approches antérieures d'apprentissage auto-supervisé et supervisé complet ainsi que les méthodes qui entraînent à partir de zéro. Pour faciliter le développement ultérieur des modèles médicaux 3D, notre code et les poids du modèle pré-entraîné sont disponibles publiquement sur https://github.com/urmagicsmine/CSPR.