要約
組織病理学的検査は、病理医がガラススライド上に腫瘍の存在を確認することで行われる、がん診断における長年にわたる慣例である。通常の実験室プロトコルから得られるスライドには、手術的切除時の合併症によって意図せず生じるアーティファクトが含まれることがある。膀胱腫瘍の経尿道的切除(TUR-BT)では、血液や損傷した組織といったアーティファクトが特に一般的な問題である。また、各実験室における組織処理手順の違いにより、色調のばらつきや診断結果のわずかな不一致が生じることもある。ガラススライドのデジタル化された形態である「ホールスライドイメージ(WSI)」は、自動診断への大きな可能性を秘めている。しかし、WSIに診断上無関係な領域が含まれていると、病理医および計算病理学(CPATH)システムの診断価値が損なわれる。したがって、診断上無関係な領域を自動的に検出し除外することは、より信頼性の高い予測を実現する可能性がある。本論文では、診断上重要な組織と比較して、血液および損傷組織を検出することを目的とする。また、学習から再構築する(from scratch)手法と、転移学習(transfer learning)の有効性を比較評価する。最良のモデルでは、血液検出に対してF1スコア0.99、損傷組織検出に対してF1スコア0.89を達成した。血液および損傷組織は微細な色の違いしか持たないため、5つの代表的な深層学習アーキテクチャにおける、色処理手法が2値分類性能に与える影響を検証した。さらに、色情報を除去することで、分類性能における形態情報(morphology)と色情報の相対的な重要性を明らかにした。