HyperAI超神经
17 days ago

使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模

Talal Widatalla, Richard W. Shuai, Brian Hie, Possu Huang
使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模
摘要

当前基于深度学习的固定主链蛋白质序列设计方法在生成序列时并未建模蛋白质侧链构象,尽管侧链原子的三维排列在蛋白质构象、稳定性和整体功能中起着重要作用。相反,这些模型仅根据主链几何结构和氨基酸序列隐式推断关键的侧链相互作用。为了解决这一问题,我们提出了FAMPNN(全原子MPNN),这是一种显式建模每个残基的序列身份和侧链构象的方法,其中每个残基的离散氨基酸身份和连续侧链构象的概率分布通过联合分类交叉熵和扩散损失目标进行学习。我们证明了联合学习这些分布是一项高度协同的任务,不仅提高了序列恢复的准确性,还实现了最先进的侧链堆积效果。此外,显式全原子建模的优势从序列恢复扩展到了实际的蛋白质设计应用中,例如零样本预测实验结合力和稳定性测量。