2달 전
Virchow: 백만 개 슬라이드 디지털 병리학 기초 모델
Eugene Vorontsov; Alican Bozkurt; Adam Casson; George Shaikovski; Michal Zelechowski; Siqi Liu; Kristen Severson; Eric Zimmermann; James Hall; Neil Tenenholtz; Nicolo Fusi; Philippe Mathieu; Alexander van Eck; Donghun Lee; Julian Viret; Eric Robert; Yi Kan Wang; Jeremy D. Kunz; Matthew C. H. Lee; Jan Bernhard; Ran A. Godrich; Gerard Oakley; Ewan Millar; Matthew Hanna; Juan Retamero; William A. Moye; Razik Yousfi; Christopher Kanan; David Klimstra; Brandon Rothrock; Thomas J. Fuchs

초록
인공지능을 활용하여 병리 이미지를 분석하여 정밀의학과 의사결정 시스템을 가능하게 함으로써 암의 진단과 치료를 혁신할 수 있는 잠재력이 있습니다. 이러한 응용 프로그램은 병리 이미지에서 관찰되는 다양한 패턴을 포착하는 모델의 능력에 크게 의존할 것입니다. 이 문제를 해결하기 위해, 우리는 계산병리학을 위한 기초 모델인 Virchow를 소개합니다. DINOv2 알고리즘을 활용한 자기 지도 학습을 통해 Virchow는 6억 3200만 개의 매개변수를 가진 비전 트랜스포머 모델로, 다양한 조직 및 검체 유형에서 얻은 150만 장의 헤마토실린-에오신 염색 전체 슬라이드 이미지를 사용하여 훈련되었습니다. 이는 이전 연구보다 몇 배나 더 많은 데이터입니다. Virchow 모델은 17가지 다른 암 유형에서 0.949의 총 검체 단위 AUC(영역 밑 면적)를 달성하며, 동시에 7가지 희귀 암 유형에서 0.937의 AUC를 기록하였습니다. Virchow 모델은 내부 및 외부 이미지 타일 단위 벤치마크와 슬라이드 단위 바이오마커 예측 과제에서 최고 성능을 보여주며, 성능 향상은 대규모 병리 이미지 데이터셋에서 훈련하는 것이 중요함을 강조합니다. 이는 제한된 양의 훈련 데이터가 제공되는 많은 고영향 계산병리학 응용 프로그램에서 데이터와 네트워크 구조를 확장함으로써 정확성을 높일 수 있음을 시사합니다.