解锁LASSO肽语言:驱动肽类工程化设计新范式
在寻找癌症和感染性疾病新疗法的过程中,lasso肽因其独特的“绳结”结构展现出巨大潜力——这种结构赋予分子极高的稳定性及多样的生物活性,成为药物研发的热门方向。为更高效地挖掘其临床价值,伊利诺伊大学厄本那-香槟分校与范德比尔特大学的研究团队合作,开发出首个专用于lasso肽的大型语言模型——LassoESM,相关成果发表于《自然·通讯》。 lasso肽由细菌通过核糖体合成氨基酸链,并由特定酶催化形成类似“滑结”的三维结构。自然界中已发现数千种此类分子,部分具有抗菌、抗病毒和抗癌活性。然而,传统AI工具如AlphaFold在预测lasso肽结构时表现不佳,因其结构特殊,现有模型缺乏针对性训练数据。 为此,研究团队由化学与生物分子工程学教授迪瓦卡·舒克拉(Diwakar Shukla)与范德比尔特大学化学生物学研究所主任道格·米切尔(Doug Mitchell)共同领导,基于ESM-2架构,采用掩码语言建模技术,对数千条经人工验证的lasso肽序列进行深度预训练,构建出LassoESM模型。该模型能学习lasso肽的“语言”——即氨基酸序列与结构形成之间的内在规律。 LassoESM成功实现了多项关键预测任务:准确识别不同lasso肽与非对应酶(lasso cyclase)之间的兼容性,预测酶对底物的容忍度,并评估其抑制RNA聚合酶的活性。这些能力极大提升了肽工程的效率,使研究人员能更精准地设计具有特定功能的lasso肽。 研究团队指出,该模型在实验数据有限的情况下仍能实现高精度预测,为理性设计功能性肽类药物提供了强大AI工具。未来,团队计划将模型扩展至其他天然肽类,并进一步开发可靶向特定蛋白的定制化lasso肽。 该研究得益于伊利诺伊大学校内强大算力支持及卡尔·R·沃斯基因组生物学研究所跨学科协作平台,体现了计算与实验科学深度融合的潜力。
