利用变分自编码器设计适用于真核生物的多样化、功能性线粒体靶向序列
Aashutosh Girish Boob, Shih-I Tan, Airah Zaidi, Nilmani Singh, Xueyi Xue, Shuaizhen Zhou, Teresa A. Martin, Li-Qing Chen , Huimin Zhao
发布日期: 6/9/2025

摘要
线粒体在能量生产和代谢过程中发挥关键作用,因此是代谢工程和疾病治疗中颇具前景的靶点。尽管已有研究表明伴随蛋白(passenger proteins)会影响定位效率,但目前已被表征的用于线粒体靶向的蛋白定位标签仍然非常有限。为了解决这一限制,我们利用变分自编码器(Variational Autoencoder, VAE)设计了新的线粒体靶向序列。计算机模拟分析显示,所生成肽段中有高达90.14%具有功能性,并具备线粒体靶向所需的重要特征。我们在四种真核生物中对这些人工合成肽段进行了功能验证,并以此作为概念验证(proof-of-concept),展示了它们在代谢通路分隔中提高3-羟基丙酸产量、以及将5-氨基乙酰丙酸合酶(5-aminolevulinate synthase)递送效率提高了1.62倍和4.76倍的实用价值。此外,我们还利用潜空间插值(latent space interpolation)方法,探索了双重定位序列(dual-targeting sequences)的进化起源。总的来说,我们的研究展示了生成式人工智能在基础研究和线粒体生物学实际应用中的巨大潜力。