DINO-CXR : Une méthode auto-supervisée basée sur le modèle vision Transformer pour la classification des radiographies thoraciques

La disponibilité limitée des jeux de données d’examens radiographiques thoraciques étiquetés constitue un obstacle majeur dans le développement des méthodes d’imagerie médicale. L’apprentissage auto-supervisé (SSL) permet de pallier ce problème en entraînant des modèles sur des données non étiquetées. En outre, la pré-formation auto-supervisée a donné des résultats prometteurs pour la reconnaissance visuelle d’images naturelles, mais elle a reçu peu d’attention dans le domaine de l’analyse d’images médicales. Dans ce travail, nous proposons une méthode auto-supervisée, DINO-CXR, qui constitue une adaptation originale d’une méthode auto-supervisée, DINO, basée sur un transformateur visuel, pour la classification des radiographies thoraciques. Une analyse comparative est menée afin de démontrer l’efficacité de la méthode proposée pour la détection de la pneumonie et du COVID-19. Une analyse quantitative montre également que la méthode proposée dépasse les méthodes de pointe en termes de précision, tout en atteignant des résultats comparables en termes d’AUC et de score F-1, tout en nécessitant une quantité significativement réduite de données étiquetées.