Êtes-vous sûr que c’est un artefact ? Détection des artefacts et quantification de l'incertitude dans les images histologiques
Les diagnostics du cancer modernes impliquent l’extraction de spécimens tissulaires à partir de zones suspectes, suivie de procédures histotechniques visant à préparer une lame numérique en verre, appelée Image de lame entière (Whole Slide Image, WSI), destinée à une analyse ultérieure. Ces procédures introduisent fréquemment divers types d’artefacts dans les WSIs obtenues, et ces artefacts histologiques peuvent compromettre les systèmes de pathologie computationnelle (CPATH) dans la chaîne de diagnostic si leurs effets ne sont pas exclus ou correctement gérés. Bien que les réseaux de neurones convolutifs profonds (DCNN) aient obtenu des résultats prometteurs pour la détection de certains artefacts présents dans les WSIs, ils ne prennent pas en compte l’incertitude dans leurs prédictions. Ce papier propose un modèle d’apprentissage profond à noyau (Deep Kernel Learning, DKL) sensible à l’incertitude, destiné à détecter deux types d’artefacts courants dans les WSIs : les zones floues et les tissus pliés. Le modèle probabiliste proposé combine un extracteur de caractéristiques basé sur un réseau neuronal convolutif (CNN) et un classificateur à processus gaussiens creux (GPs), améliorant ainsi les performances des méthodes actuelles de détection d’artefacts basées sur les DCNN tout en fournissant des estimations d’incertitude. Nous avons obtenu des scores F1 de 0,996 et 0,938 pour la détection du flou et des tissus pliés, respectivement, sur des données non vues. Dans des expérimentations étendues, le modèle DKL a été validé sur des données non vues provenant de cohortes indépendantes externes, présentant différentes techniques de teinture et types de tissus, où il a surpassé les DCNN. De manière intéressante, le modèle DKL affiche une plus grande confiance dans les prédictions correctes et une moindre confiance dans les erreurs. Le modèle DKL proposé peut être intégré dans la phase de prétraitement des systèmes CPATH afin d’assurer des prédictions fiables, et pourrait éventuellement servir d’outil de contrôle qualité.