15 天前
一种新的图节点分类基准:从组织病理学细胞图中学习结构
Claudia Vanea, Jonathan Campbell, Omri Dodi, Liis Salumäe, Karen Meir, Drorith Hochner-Celnikier, Hagit Hochner, Triin Laisk, Linda M. Ernst, Cecilia M. Lindgren, Christoffer Nellåker

摘要
我们提出一个全新的基准数据集——Placenta,用于一个尚未充分探索的领域:基于胎盘组织全切片图像中的细胞图(cell graphs)进行节点分类,以预测微细解剖组织结构。这一问题对图学习方法构成了独特挑战,主要原因有以下几点:细胞图规模庞大(每幅图像包含超过一百万个节点),节点特征多样(包含11种细胞类型的64维特征),类别标签严重不平衡(共9个类别,占比从数据集的0.21%至40.0%不等),且细胞群体聚集成异质分布的组织区域,其规模差异极大(单个结构的节点数从11个到44,671个不等)。在此,我们发布了一个包含两幅胎盘组织切片图像的细胞图数据集,总计包含2,395,747个节点,其中799,745个节点附有真实标签(ground truth)。我们针对7种可扩展模型提供了归纳式(inductive)基准测试结果,并展示了细胞图的独特性质如何推动新型图神经网络架构的发展。