摘要
深度学习在定量图像分析中的应用正呈指数级增长。然而,训练准确且具备广泛适用性的深度学习算法,需要大量已标注(即真实值)的数据。图像数据集不仅需包含数千张图像以提供充足的样本对象(如细胞),还必须具备足够的图像异质性。本文介绍了一种新型数据集——EVICAN(Expert Visual Cell Annotation),该数据集包含来自多种显微镜、不同对比成像机制及多种放大倍数的30种不同细胞系的部分标注灰度图像,可直接用于计算机视觉应用的训练。本数据集共包含4600张图像和约26,000个分割细胞,为细胞生物学领域的深度学习应用开发提供了前所未有的异质性训练数据资源。基于Mask R-CNN的实现,我们展示了在明场图像中实现细胞及细胞核自动分割的能力,其平均精度(mean average precision)达到61.6%,且在Jaccard指数高于0.5的条件下表现优异。