CAMIL : Apprentissage par instances multiples conscient de son contexte pour la détection et la sous-typisation du cancer dans les images de lame entière

L’examen visuel des coupes de biopsie tissulaire constitue une étape fondamentale dans le diagnostic du cancer, les pathologistes analysant ces coupes à plusieurs grossissements afin de distinguer les cellules tumorales et leurs sous-types. Toutefois, les modèles existants basés sur l’apprentissage par instances multiples (MIL) à mécanisme d’attention, utilisés pour l’analyse des images de lame entière (WSI) en diagnostics du cancer, négligent souvent les informations contextuelles relatives aux tuiles tumorales et à leurs voisines, ce qui entraîne des classifications erronées. Pour remédier à ce problème, nous proposons une architecture appelée CAMIL (Context-Aware Multiple Instance Learning). CAMIL intègre une attention contrainte par voisinage afin de prendre en compte les dépendances entre les tuiles au sein d’une WSI, tout en intégrant des contraintes contextuelles comme connaissance a priori dans le modèle MIL. Nous avons évalué CAMIL sur la sous-typage du cancer non à petites cellules du poumon (TCGA-NSCLC) ainsi que sur la détection de métastases dans les ganglions lymphatiques (CAMELYON16 et CAMELYON17), obtenant des scores AUC de test respectivement de 97,5 %, 95,9 % et 88,1 %, dépassant ainsi les méthodes de pointe actuelles. En outre, CAMIL améliore l’interprétabilité du modèle en identifiant les régions présentant une valeur diagnostique élevée.