摘要
乳腺癌是临床上最常见的实体瘤之一。乳腺X线摄影(mammography)是目前最广泛使用的乳腺癌筛查技术。传统的基于手工特征的乳腺影像分类或分割方法,通常依赖大量人工标注的分割数据进行模型训练与结果验证。然而,人工标注过程成本高昂、耗时且劳动强度大,显著增加了系统构建的总体成本。为降低这一成本并减轻放射科医师的工作负担,本文提出一种基于深度神经网络的端到端全图乳腺影像分类方法,用于构建分类器。该方法无需训练数据中的边界框(bounding boxes)或掩码(mask)真值标签,仅需乳腺影像的分类标签即可完成模型构建。这类标签可相对容易地从诊断报告中获取。由于乳腺病灶通常仅占乳腺影像总可视区域的一小部分,本文提出了一种针对卷积神经网络(CNN)的新型池化结构,替代传统的池化方法。该结构通过将图像划分为多个区域,并选取恶性概率较高的若干区域作为整幅乳腺影像的代表性特征,从而更有效地捕捉病灶信息。所提出的池化结构可广泛应用于大多数基于CNN的模型,且在输入不变的前提下,显著提升了模型在乳腺影像数据上的性能表现。在公开可获取的INbreast数据集与CBIS数据集上的实验结果表明,与以往基于分割标注的先进乳腺影像分类器及检测算法相比,本文所提出的池化结构在乳腺影像分类任务中表现出优异的性能。