DTFD-MIL : Double-Tier Feature Distillation Multiple Instance Learning pour la classification des images histopathologiques à grand champ

L'apprentissage par instances multiples (MIL) est de plus en plus utilisé pour la classification des images histopathologiques entières (WSI). Toutefois, les approches MIL spécifiques à ce problème de classification font encore face à des défis uniques, notamment ceux liés aux cohortes de petits échantillons. Dans ces cas, le nombre d’images WSI (ou « sacs ») est limité, tandis que la résolution d’une seule WSI est très élevée, entraînant un grand nombre de morceaux (ou « instances ») extraits de chaque slide. Pour surmonter ce problème, nous proposons d’augmenter virtuellement le nombre de sacs en introduisant le concept de « pseudo-sacs », sur lesquels nous construisons un cadre MIL à deux niveaux afin d’exploiter efficacement les caractéristiques intrinsèques. En outre, nous apportons une contribution en dérivant la probabilité d’instance dans le cadre du MIL basé sur l’attention, et utilisons cette dérivation pour aider à concevoir et analyser le cadre proposé. La méthode proposée surpasse nettement les autres approches récentes sur le jeu de données CAMELYON-16, avec une marge significative, et obtient également de meilleurs résultats sur le jeu de données TCGA de cancer du poumon. Le cadre proposé est prêt à être étendu à d’autres applications du MIL. Le code est disponible à l’adresse suivante : https://github.com/hrzhang1123/DTFD-MIL