Classification de la cytopathologie cervicale à l’aide de la sélection de caractéristiques profondes améliorée par PCA et GWO

Le cancer du col de l’utérus est l’une des maladies les plus fréquentes et les plus mortelles touchant les femmes dans le monde. Il est entièrement curable si détecté à un stade précoce, mais la procédure de dépistage fastidieuse et coûteuse rend son application à grande échelle impossible. Afin de soutenir les cliniciens dans leurs efforts, nous proposons dans cet article un cadre entièrement automatisé basé sur l’apprentissage profond (Deep Learning) et la sélection de caractéristiques par optimisation évolutionnaire pour la classification d’images de cytopathologie. Le cadre proposé extrait des caractéristiques profondes à partir de plusieurs modèles de réseaux de neurones convolutifs (CNN), puis applique une approche en deux étapes pour réduire la dimensionnalité des données, afin de diminuer le coût computationnel et d’accélérer la convergence. Les caractéristiques extraites des modèles CNN forment un espace de caractéristiques de grande dimension, dont la dimension est réduite par l’analyse en composantes principales (ACP), tout en préservant 99 % de la variance. Ensuite, un sous-ensemble optimal et non redondant de caractéristiques est sélectionné à partir de cet espace à l’aide d’un algorithme d’optimisation évolutionnaire, le Grey Wolf Optimizer (GWO), ce qui améliore significativement la performance de classification. Enfin, le sous-ensemble de caractéristiques sélectionné est utilisé pour entraîner un classificateur SVM afin de générer les prédictions finales. Le cadre proposé a été évalué sur trois jeux de données publics et largement utilisés comme références : le jeu de données Mendeley Liquid Based Cytology (4 classes), le jeu de données Herlev Pap Smear (7 classes) et le jeu de données SIPaKMeD Pap Smear (5 classes), atteignant des taux de précision respectifs de 99,47 %, 98,32 % et 97,87 %, ce qui confirme la fiabilité et l’efficacité de l’approche. Le code source associé à cette méthode est disponible à l’adresse suivante : https://github.com/DVLP-CMATERJU/Two-Step-Feature-Enhancement