Virchow : Un Modèle Fondamental de Pathologie Numérique à un Million de Coupes Histologiques

L'utilisation de l'intelligence artificielle pour permettre la médecine de précision et les systèmes d'aide à la décision grâce à l'analyse d'images pathologiques a le potentiel de révolutionner le diagnostic et le traitement du cancer. De telles applications dépendront de la capacité des modèles à capturer les diverses configurations observées dans les images pathologiques. Pour relever ce défi, nous présentons Virchow, un modèle fondamental pour la pathologie computationnelle. En utilisant un apprentissage auto-supervisé renforcé par l'algorithme DINOv2, Virchow est un modèle de transformateur visuel doté de 632 millions de paramètres, formé sur 1,5 million d'images complètes colorées au hématoxyline et éosine provenant de différents types de tissus et d'échantillons, soit plusieurs ordres de grandeur plus de données que les travaux précédents. Le modèle Virchow permet le développement d'un système de détection pancancéreuse avec une AUC (aire sous la courbe) globale au niveau des échantillons de 0,949 pour 17 types différents de cancer, tout en atteignant une AUC de 0,937 pour 7 types rares de cancer. Le modèle Virchow établit l'état de l'art sur les référentiels internes et externes au niveau des tuiles d'images et sur les tâches de prédiction des biomarqueurs au niveau des diapositives. Les gains en performance soulignent l'importance d'une formation sur des ensembles massifs d'images pathologiques, suggérant que l'accroissement des données et de l'architecture du réseau peut améliorer la précision pour nombreuses applications importantes en pathologie computationnelle où les quantités limitées de données d'apprentissage sont disponibles.