HyperAI超神经
3 days ago

全原子生成模型用于设计蛋白质复合物

Ruizhe Chen, Dongyu Xue, Xiangxin Zhou, Zaixiang Zheng, xiangxiang Zeng, Quanquan Gu
全原子生成模型用于设计蛋白质复合物
摘要

蛋白质通常以复合体的形式存在,与其他蛋白质或生物分子相互作用以执行其特定的生物学功能。单链蛋白建模的研究已经得到了广泛而深入的探索,如ESM系列模型和AlphaFold2等取得了显著进展。然而,尽管这些多链蛋白对于理解生物学功能至关重要,但对其研究和建模仍处于相对未开发的状态。认识到这些相互作用的重要性,我们引入了APM(全原子蛋白生成模型),这是一种专门用于多链蛋白建模的模型。通过整合原子级信息并利用多链蛋白的数据,APM能够精确地模拟链间相互作用,并从头设计具有结合能力的蛋白质复合体。此外,APM还能够完成多链蛋白的折叠和逆折叠任务。在下游应用中,APM表现出高度的灵活性:通过监督微调(Supervised Fine-Tuning, SFT)可以提升性能,同时在某些任务中支持零样本采样,达到当前最佳水平。我们的代码已发布在https://github.com/bytedance/apm。