HyperAIHyperAI
il y a 17 jours

Amélioration de l'estimation assistée par ordinateur de la sévérité de la colite ulcéreuse selon le score endoscopique de Mayo en utilisant un apprentissage profond basé sur la régression

{Ozlen Atug, Alptekin Temizel, Yesim Ozen Alahdab, Ilkay Ergenc, Haluk Tarik Kani, Gorkem Polat}
Résumé

Contexte : L’évaluation de l’activité endoscopique dans la colite ulcéreuse (CU) est essentielle pour guider les décisions thérapeutiques et surveiller l’évolution de la maladie. Toutefois, la variabilité importante entre et au sein des observateurs lors du classement nuit à l’objectivité de cette évaluation. Notre objectif était de développer un système d’aide au diagnostic assisté par ordinateur fondé sur l’apprentissage profond afin de réduire la subjectivité et d’améliorer la fiabilité de cette évaluation.Méthodes : La cohorte inclut 11 276 images provenant de 564 patients ayant subi une coloscopie pour évaluation de la CU. Nous proposons une approche basée sur la régression, utilisant des réseaux de neurones convolutifs (CNN) d’état de l’art, pour l’évaluation endoscopique de la CU selon le score endoscopique de Mayo (MES). Cinq architectures CNN de pointe ont été utilisées pour mesurer et comparer les performances. Une validation croisée à dix plis a été appliquée pour entraîner les modèles et les comparer de manière objective. La performance des modèles a été évaluée à l’aide du kappa pondéré quadratique et du score F1 macro pour la classification complète du score de Mayo, ainsi que du kappa et du score F1 pour la classification de la rémission.Résultats : Les cinq CNN basés sur la classification utilisés dans cette étude ont montré une excellente concordance avec les annotations d’experts pour l’ensemble des sous-scores de Mayo et pour la classification de la rémission, selon les statistiques du kappa. Lorsque l’approche régressive proposée a été appliquée, (1) les performances de la plupart des modèles ont augmenté de manière statistiquement significative, et (2) le même modèle entraîné sur différentes plis de validation a produit des résultats plus robustes sur l’ensemble de test, en termes de faible déviation entre les plis.Conclusions : Les évaluations expérimentales approfondies montrent que les architectures CNN classiques basées sur la classification obtiennent des performances satisfaisantes dans l’évaluation de l’activité endoscopique de la CU. L’intégration de connaissances spécifiques au domaine dans ces architectures améliore davantage leurs performances et leur robustesse, accélérant ainsi leur mise en œuvre clinique.