Virchow: Ein digitales Pathologie-Grundmodell mit einer Million Schnitten

Die Verwendung künstlicher Intelligenz zur Ermöglichung präziser Medizin und Entscheidungsunterstützungssysteme durch die Analyse von Pathologiebildern hat das Potenzial, die Diagnostik und Therapie von Krebs zu revolutionieren. Solche Anwendungen werden von den Fähigkeiten der Modelle abhängen, die vielfältigen Muster in Pathologiebildern zu erfassen. Um dieser Herausforderung gerecht zu werden, stellen wir Virchow vor, ein Fundamentmodell für die computergestützte Pathologie. Mit dem DINOv2-Algorithmus gestärktem selbstüberwachten Lernen ist Virchow ein Vision Transformer-Modell mit 632 Millionen Parametern, das auf 1,5 Millionen Hämatoxylin-Eosin-gefärbten ganzen Bildplatten aus verschiedenen Geweben und Probenarten trainiert wurde, was um Größenordnungen mehr Daten als frühere Arbeiten darstellt. Das Virchow-Modell ermöglicht die Entwicklung eines pancanzer-Erkennungssystems mit einem gesamten Proben-AUC von 0,949 über 17 verschiedene Krebstypen hinweg und erreicht gleichzeitig einen AUC von 0,937 bei 7 seltenen Krebstypen. Das Virchow-Modell setzt neue Maßstäbe in internen und externen Bildkachelbenchmarks sowie in Biomarkerprädiktionsaufgaben auf Slide-Ebene. Die Leistungssteigerungen unterstreichen die Bedeutung des Trainings auf umfangreichen Pathologiebilddatensätzen und deuten darauf hin, dass eine Skalierung der Datenmenge und der Netzarchitektur die Genauigkeit vieler hochimpactiger computergestützter Pathologieanwendungen verbessern kann, bei denen nur begrenzte Mengen an Trainingsdaten verfügbar sind.