15日前
多様な病理学データセットにおける自己教師学習のベンチマーキング
Mingu Kang, Heon Song, Seonwook Park, Donggeun Yoo, Sérgio Pereira

要約
計算病理学は人的命を救う可能性を秘めているが、モデルはアノテーションに依存しており、病理画像のアノテーションは伝統的に極めて高コストである。自己教師学習(Self-supervised Learning, SSL)はラベルなしデータを有効活用する有効な手法として示されており、病理学分野への応用は、その後続タスクに大きな恩恵をもたらす可能性がある。しかし、SSL手法の比較に関する体系的な研究はこれまで存在せず、病理学に適応させる方法についての議論も不足している。こうした課題に対応するため、本研究では、これまでにない大規模なスケールで病理画像データに対するSSL事前学習に関する調査を実施した。本研究では、4つの代表的なSSL手法を用い、多様な下流タスクにおいて評価を実施した。その結果、標準的なSSL設定(線形評価やファインチューニング評価)およびラベル数が限られた低ラベル環境下においても、大規模なドメイン整合型事前学習がImageNetベースの事前学習を一貫して上回ることが明らかになった。さらに、ドメイン特有の技術群を提案し、実験的にそれらが性能向上に寄与することを示した。最後に、本研究では初めて、自己教師学習を核のインスタンスセグメンテーションという困難なタスクに適用し、多様な設定下で顕著かつ一貫した性能向上を達成した。