
摘要
我们针对全切片图像(Whole Slide Image, WSI)分类这一具有挑战性的问题展开研究。WSI具有极高的分辨率,且通常缺乏局部标注信息。当仅有切片级别的标签可用时,WSI分类可被建模为多实例学习(Multiple Instance Learning, MIL)问题。为此,我们提出了一种基于MIL的WSI分类与肿瘤检测方法,该方法无需依赖局部标注信息。我们的方法包含三个核心组件:首先,我们提出一种新颖的MIL聚合器,采用双流架构并引入可学习的距离度量机制,以建模实例之间的关系;其次,鉴于WSI可能产生规模庞大或分布不均的“包”(bags),这对MIL模型的训练构成挑战,我们引入自监督对比学习,以提取适用于MIL的高质量特征表示,同时有效缓解大规模“包”带来的高昂内存开销问题;第三,我们采用金字塔融合机制对多尺度WSI特征进行整合,进一步提升了分类与定位的准确性。我们在两个具有代表性的WSI数据集上对所提模型进行了评估,结果表明,该模型的分类准确率与全监督方法相比仅存在不到2%的差距,在多个数据集上均表现优异,显著优于以往所有基于MIL的方法。此外,在标准MIL数据集上的额外基准测试结果进一步验证了所提出MIL聚合器在通用MIL任务中的优越性能。项目代码已开源,详见GitHub仓库:https://github.com/binli123/dsmil-wsi