摘要
组织病理学检查长期以来一直是癌症诊断的重要手段,病理学家通过观察玻璃切片来识别肿瘤的存在。常规实验室获取的切片可能因手术切除过程中的并发症而引入非故意的伪影。在膀胱肿瘤经尿道切除术(transurethral resection of the bladder tumor, TURBT)中,血液残留和组织损伤是两类常见的问题。不同实验室在组织技术处理流程上的差异,也可能导致染色颜色的变异以及诊断结果的细微不一致。将玻璃切片数字化后形成的全切片图像(whole slide image, WSI)为自动化病理诊断提供了巨大潜力。然而,WSI中包含的非诊断相关区域会降低其对病理医生及计算病理学(computational pathology, CPATH)系统的价值。因此,自动识别并排除这些非诊断相关区域,有助于提升预测结果的可靠性。本文聚焦于对血液和组织损伤区域与诊断相关组织区域的检测。我们评估了迁移学习相较于从零开始训练的有效性。最优模型在血液检测和组织损伤检测任务上分别取得了0.99和0.89的F1分数。由于血液与组织损伤区域在颜色上差异细微,我们进一步考察了多种颜色处理方法对五种主流深度学习架构在二分类任务中性能的影响。最后,通过去除颜色信息,探究颜色特征在分类性能中相对于形态学特征的重要性。