il y a 2 mois

Virchow : Un Modèle Fondamental de Pathologie Numérique à un Million de Coupes Histologiques

Eugene Vorontsov; Alican Bozkurt; Adam Casson; George Shaikovski; Michal Zelechowski; Siqi Liu; Kristen Severson; Eric Zimmermann; James Hall; Neil Tenenholtz; Nicolo Fusi; Philippe Mathieu; Alexander van Eck; Donghun Lee; Julian Viret; Eric Robert; Yi Kan Wang; Jeremy D. Kunz; Matthew C. H. Lee; Jan Bernhard; Ran A. Godrich; Gerard Oakley; Ewan Millar; Matthew Hanna; Juan Retamero; William A. Moye; Razik Yousfi; Christopher Kanan; David Klimstra; Brandon Rothrock; Thomas J. Fuchs

Voir les détails de l'article

Virchow : Un Modèle Fondamental de Pathologie Numérique à un Million de Coupes Histologiques

Résumé

L'utilisation de l'intelligence artificielle pour permettre la médecine de précision et les systèmes d'aide à la décision grâce à l'analyse d'images pathologiques a le potentiel de révolutionner le diagnostic et le traitement du cancer. De telles applications dépendront de la capacité des modèles à capturer les diverses configurations observées dans les images pathologiques. Pour relever ce défi, nous présentons Virchow, un modèle fondamental pour la pathologie computationnelle. En utilisant un apprentissage auto-supervisé renforcé par l'algorithme DINOv2, Virchow est un modèle de transformateur visuel doté de 632 millions de paramètres, formé sur 1,5 million d'images complètes colorées au hématoxyline et éosine provenant de différents types de tissus et d'échantillons, soit plusieurs ordres de grandeur plus de données que les travaux précédents. Le modèle Virchow permet le développement d'un système de détection pancancéreuse avec une AUC (aire sous la courbe) globale au niveau des échantillons de 0,949 pour 17 types différents de cancer, tout en atteignant une AUC de 0,937 pour 7 types rares de cancer. Le modèle Virchow établit l'état de l'art sur les référentiels internes et externes au niveau des tuiles d'images et sur les tâches de prédiction des biomarqueurs au niveau des diapositives. Les gains en performance soulignent l'importance d'une formation sur des ensembles massifs d'images pathologiques, suggérant que l'accroissement des données et de l'architecture du réseau peut améliorer la précision pour nombreuses applications importantes en pathologie computationnelle où les quantités limitées de données d'apprentissage sont disponibles.