3 个月前
利用STATE预测细胞在不同环境下对扰动的反应
Abhinav K. Adduri, Dhruv Gautam, Beatrice Bevilacqua, Alishba Imran, Rohan Shah, Mohsen Naghipourfar, Noam Teyssier, Rajesh Ilango, et al

摘要
细胞对扰动的响应是理解生物机制和选择潜在药物靶点的关键。尽管计算模型在预测扰动效应方面比实验方法具有巨大潜力,但它们目前仍难以将从实验观察到的细胞环境中获得的影响推广到未观察到的环境中。在此,我们介绍了一种名为State的机器学习架构,该架构能够在考虑细胞异质性的基础上预测扰动效应。State跨越了物理尺度:它包含一个状态转换模型,该模型利用超过1亿个受扰动细胞的数据(涵盖70种细胞环境)来学习不同细胞集合之间的扰动效应;以及一个基于1.67亿个人类单细胞观测数据训练的细胞嵌入模型。State在多个大型数据集上提高了超过50%的扰动效应区分能力,并且相比现有模型,其识别遗传、信号传导和化学扰动下真正差异表达基因的准确性提高了两倍以上。通过其嵌入模型,State还能够在训练过程中未观察到扰动的新细胞环境中识别出强烈的扰动。我们进一步引入了Cell-Eval,这是一个使用生物学相关指标的全面评估框架,突显了State如何实现更精确地发现特定细胞类型的扰动响应,例如与细胞存活相关的响应。总体而言,State的性能和灵活性为虚拟细胞模型开发的大规模推进奠定了基础。