TransMIL : apprentissage par instances multiples corrélées basé sur Transformer pour la classification d’images de lame entière

L'apprentissage par instances multiples (MIL) constitue un outil puissant pour résoudre le problème de classification faiblement supervisée dans le diagnostic pathologique basé sur les images de diapositives entières (WSI). Toutefois, les méthodes actuelles de MIL reposent généralement sur l'hypothèse d'indépendance et d'identité de distribution, négligeant ainsi les corrélations entre différentes instances. Pour remédier à ce défaut, nous proposons un nouveau cadre, nommé MIL corrélé, accompagné d'une preuve de convergence. Sur la base de ce cadre, nous avons conçu une méthode de MIL fondée sur le Transformer, appelée TransMIL, qui exploite simultanément les informations morphologiques et spatiales. La méthode TransMIL proposée permet efficacement de traiter des classifications binaires ou multiples, équilibrées ou déséquilibrées, tout en offrant une excellente visualisation et interprétabilité. Nous avons mené diverses expériences sur trois problèmes différents en pathologie computationnelle, obtenant des performances supérieures et une convergence plus rapide par rapport aux méthodes de pointe. Le score AUC sur le test de classification binaire des tumeurs atteint jusqu’à 93,09 % sur le jeu de données CAMELYON16. Quant à la classification des sous-types de cancer, les scores AUC atteignent respectivement 96,03 % sur le jeu de données TCGA-NSCLC et 98,82 % sur le jeu de données TCGA-RCC. Le code source est disponible à l’adresse suivante : https://github.com/szc19990412/TransMIL.