内容一览:研究表明细胞衰老与癌症、 2 型糖尿病、骨关节炎和病毒感染等疾病密切相关。尽管清除衰老细胞的药物已逐渐成为研发热点。但由于缺乏充分表征的分子靶点,已发现的抗衰老化合物 (Senolytics) 很少。近期,国际期刊《Nature Communications》上发布了一篇研究成果,研究人员新发现了 3 种 Senolytics 。
关键词:Senolytics 机器学习 XGBoost
本文首发自 HyperAI 超神经微信公众平台~
自古以来,人们一直追求长生不老。令人惊喜的是,近年来抗衰、长寿等话题,正在从神秘、虚无缥缈的保健品界,走向大众认可的医疗健康界。一般认知里,衰老就是身体机能缓慢弱化的过程,进程不可逆,所以人类只能顺其自然,听天由命。然而很多人不了解的是,早在 2018 年,世卫组织 (the World Health Organization) 就在《国际疾病法典》宣布,衰老是一种可以治疗的疾病。
在衰老的广泛定义里,细胞衰老是近来科学家们研究的热门方向之一。所谓细胞衰老 (Cellular senescence) 是一种以细胞分裂停止为特征的现象。通常情况下,人体免疫系统能够有效清除衰老细胞 (Senescent cells),但随着年龄的增长,这种清除功能会逐渐减弱,除了会导致视力恶化、活动能力受限等,还极易引发癌症、阿尔茨海默病等多种疾病。
2015 年,梅奥诊所的 James L. Kirkland 博士等人发现了第一种能够清除衰老细胞的抗衰药 (Senolytics) ,Senolytics 指选择性诱导衰老细胞死亡的小分子化合物,其名称源自 Senescence (衰老) 和 Lytic (破坏) 。最新研究中,爱丁堡大学联合坎塔布里亚大学利用机器学习发现了三种 Senolytics—— Ginkgetin, Periplocin 及 Oleandrin,并验证了其在人类细胞系中的抗衰作用。目前该研究已发布在《Nature Communications》期刊上,标题为「Discovery of Senolytics using machine learning」。
图 1:该研究成果已发表在 Nature Communications
论文地址:
https://www.nature.com/articles/s41467-023-39120-1#Sec2
本实验数据集来自多个渠道,包括学术出版物和商业专利。首先,研究人员挖掘了 58 种已知的 Senolytics,而后又从 LOPAC-1280 及 Prestwick FDA-approved-1280 两个已有的化学库中挖掘了多种非 Senolytics 。数据集将二者进行了整合,共包含 2,523 种化合物,其中 Senolytics 占 2.3% 。
图 2:用于训练机器学习模型的化合物
a:训练数据来自多个渠道。
b:用于训练的 58 种 Senolytics 来源,包括每个来源的化合物数量和细胞系 (cell lines) 。
研究人员使用上述数据集训练模型,来识别具有 Senolytics(阳性)特征的化合物。首先,研究人员对数据集进行了特征选择,在此过程中,他们利用随机森林 (RF) 模型计算了每个特征的平均基尼指数减少量,选择了 165 个最重要的特征,从而减少了特征数量,降低模型复杂度。
其次,研究人员利用 165 个最重要特征以及完整数据集中的各种样本数据,开发了多个 Senolytics 二分类模型(识别 Senolytics 或非 Senolytics)。为了比较各个模型,并充分利用有限数量的 Senolytics 样本,研究人员在数据集上进行了 5 倍交叉验证,使用 3 个性能指标对模型进行评分:精确度、召回率和 F1 得分。
起初,研究人员主要关注支持向量机 (SVM) 和 RF 模型,但经过实验发现它们的性能均不理想。同时他们还评估了其他复杂度不同的模型,包括逻辑回归器 (Logistic regressors) 、朴素贝叶斯分类器 (Naïve Bayes classifier) 和用于不平衡分类数据增强法 (SMOTE),但结果显示这些模型的性能还不如 SVM 和 RF 模型。
因此,研究人员以 RF 性能为基准,又开发了 XGBoost 模型,通过迭代地训练决策树模型提高预测能力。如图 3b 所示,XGBoost 模型在精确度、召回率和 F1 得分方面均有所提升,在所有考虑的模型中表现最佳。
图 3:训练机器学习模型
a:模型训练、化合物筛选和结果验证流程,使用多个性能指标,筛选合适的模型。
b:3 个机器学习模型性能,条形图显示在 5 倍交叉验证中计算的平均性能指标,误差条表示一个标准差。
本实验数据集地址,稍后会同步到 HyperAI 超神经官网:
https://doi.org/10.5281/zenodo.7870357
首先,研究人员从 4,340 多个化合物中筛选出了 21 种可能具有抗衰老活性的化合物。随后,他们又对这 21 种化合物进行测试,如图 4 显示,其中 3 种具有衰老细胞清除作用:Periplocin 及 Oleandrin(两种强心苷类物质,尚未被确定能够清除衰老细胞)以及 Ginkgetin(一种天然无毒的双黄酮类化合物)。
图 4:Periplocin,Oleandrin 及 Ginkgetin 具有衰老细胞清除作用
c:实验验证。 21 个化合物中有三个显示出抗衰老活性:Ginkgetin 、 Oleandrin 和 Periplocin;热力图显示了 n = 3 个重复实验的均值。图中 Ouabain 为已知 Senolytics 。
d:3 种新发现的抗衰化合物的剂量-反应曲线。 SI 为抗衰指数。
此外,上述实验过程中,研究人员还发现与 Ouabain 相比,新发现的 Oleandrin 的抗衰性更强,尤其是在低浓度情况下。因此,研究人员比较了 Periplocin 、 Oleandrin 及 Ouabain 在 10 nM 低浓度下的抗衰老活性。
图 5:Periplocin 、 Oleandrin 及 Periplocin 在低浓度下抗衰性能比较
a:图中显示了 IMR90 ER:RAS (衰老细胞) 和 IMR90 ER:STOP (对照组) 在 100 nM 4OHT 培养条件下的组织培养皿。在接下来的 72 小时内,用 10 nM Oleandrin 、 Ouabain 和 Periplocin 以及 DMSO (对照) 进行处理。
b:通过定量分析评估细胞存活率。
如图 5b 所示,低浓度的 Ouabain 和 Periplocin 在 IMR90-ER:STOP 以及 IMR90-ER:RAS 中均未表现出明显的细胞毒性,而使用 Oleandrin 进行处理后,IMR90-ER:RAS 中的衰老细胞存活率显著下降,表明 Oleandrin 在较低的药物浓度下具有较强的抗衰活性。综合以上实验结果,机器学习能成功寻找到抗衰化合物,并且还找到了比现有抗衰化合物抗衰性更强的 Oleandrin 。
AI 在新药研发的各个阶段都发挥了重要作用。目前,研究重点集中在药物发现和临床前开发阶段。这项研究展示了 AI 在药物研发中的潜力,特别是在应对生物结构复杂或已知分子靶点较少的疾病时。作者 Diego Oyarzún 指出:「AI 在帮助我们发现新的候选药物方面非常有效,尤其是在药物发现的早期阶段。」
该研究的一作 Vanessa Smer-Barreto 则强调了数据科学家、化学家和生物学家之间密切合作的重要性。她表示:「这项工作是通过数据科学家、化学家和生物学家之间的紧密合作而产生的。我们利用这种跨学科合作的优势,构建了稳健的模型,并通过仅使用已发表的数据进行模型训练来节省筛选成本。」这种合作模式为加速 AI 应用提供了新的机会,并有望推动药物研发的创新和发展。
目前,尽管 AI 在新药研发中取得了突破,但仍然面临一些挑战,例如数据质量及可靠性、算法可解释性以及模型的泛化能力等。随着技术的不断进步和数据资源的增加,AI 在药物研发中的应用前景仍然非常广阔。通过加强数据共享和跨学科合作,可以更好地利用 AI 的优势,加速新药的发现和开发,为人类健康带来福祉。
参考文章:
[1]http://zixun.69jk.cn/shwx/79532.html
[2]https://en.wikipedia.org/wiki/Cellular_senescence#Characteristics_of_senescent_cells
[3]https://newatlas.com/medical/machine-learning-algorithm-identifies-natural-anti-aging-chemicals/
[4]https://www.sohu.com/a/673349496_121124375
[5]https://www.ed.ac.uk/institute-genetics-cancer/news-and-events/news-2023/ai-algorithms-find-drugs-that-could-combat-ageing
[6]http://www.stcn.com/article/detail/904319.html
本文首发自 HyperAI 超神经微信公众平台~