2 个月前
使用高级图神经网络进行多组学整合的癌症分类比较分析
Alharbi, Fadi ; Vakanski, Aleksandar ; Zhang, Boyu ; Elbashir, Murtada K. ; Mohammed, Mohanad

摘要
多组学数据正越来越多地被用于推进癌症分类的计算方法。然而,多组学数据整合面临着高维度、数据复杂性和不同组学类型独特特征等重大挑战。本研究针对这些挑战,评估了基于图卷积网络(GCN)、图注意力网络(GAT)和图变换器网络(GTN)的三种图神经网络架构在分类31种癌症类型和正常组织中的应用。为了解决多组学数据的高维度问题,我们采用了LASSO(最小绝对收缩和选择算子)回归进行特征选择,从而创建了LASSO-MOGCN、LASSO-MOGAT和LASSO-MOTGN模型。网络结构通过基因相关矩阵和蛋白质-蛋白质相互作用网络构建,用于整合信使RNA、微小RNA和DNA甲基化数据。这种数据整合使网络能够动态关注生物实体之间的关键关系,从而提高模型性能和可解释性。在这些模型中,采用相关性图结构的LASSO-MOGAT模型达到了最先进的准确率(95.9%),并在精确度、召回率和F1分数方面优于LASSO-MOGCN和LASSO-MOTGN模型。我们的研究结果表明,在基于图的架构中整合多组学数据可以增强癌症分类性能,揭示独特的分子模式,有助于更好地理解癌症生物学并发现疾病进展的潜在生物标志物。