2ヶ月前
Virchow: 100万スライドのデジタル病理学基礎モデル
Eugene Vorontsov; Alican Bozkurt; Adam Casson; George Shaikovski; Michal Zelechowski; Siqi Liu; Kristen Severson; Eric Zimmermann; James Hall; Neil Tenenholtz; Nicolo Fusi; Philippe Mathieu; Alexander van Eck; Donghun Lee; Julian Viret; Eric Robert; Yi Kan Wang; Jeremy D. Kunz; Matthew C. H. Lee; Jan Bernhard; Ran A. Godrich; Gerard Oakley; Ewan Millar; Matthew Hanna; Juan Retamero; William A. Moye; Razik Yousfi; Christopher Kanan; David Klimstra; Brandon Rothrock; Thomas J. Fuchs

要約
人工知能を用いて病理画像の分析を通じて精密医療と意思決定支援システムを実現することは、がんの診断と治療を革命的に変える可能性を持っています。このような応用は、モデルが病理画像で観察される多様なパターンを捉える能力に依存します。この課題に対処するため、私たちはコンピュータ病理学の基盤モデルであるVirchowを提案します。DINOv2アルゴリズムによって強化された自己教師あり学習を使用し、Virchowは6億3200万パラメータを持つビジョントランスフォーマー模型であり、多様な組織や検体タイプから得られた150万枚のヘマトキシリン・エオシン染色全スライド画像で訓練されています。これは、以前の研究よりも桁違いに多くのデータです。Virchowモデルは、17種類のがんに対して全体的な検体レベルでのAUC(面積下曲線)が0.949となるパンがん検出システムの開発を可能にします。また、7種類の希少がんにおいても0.937のAUCを達成しています。Virchowモデルは内部および外部の画像タイルレベルベンチマークとスライドレベルバイオマーカー予測タスクにおいて最先端の成果を示しており、性能向上は大規模な病理画像データセットでの訓練の重要性を強調しています。これは、限られた量の訓練データしかない多くの重要なコンピュータ病理学応用において、データとネットワークアーキテクチャの拡大が精度向上につながることを示唆しています。