Command Palette
Search for a command to run...

摘要
模拟蛋白质与小分子相互作用的构象异质性,对于理解自然系统以及评估设计系统具有重要意义,但这一问题至今仍是重大挑战。我们推断,尽管在从头结构预测中,以残基为单位描述生物分子具有较高的效率,但在探究折叠态下蛋白质与小分子相互作用的构象异质性时,采用全原子层面的描述可能在速度和普适性方面具有优势。为此,我们开发了一种图神经网络模型,名为PLACER(Protein-Ligand Atomistic Conformational Ensemble Resolver),该模型通过从剑桥结构数据库(Cambridge Structural Database)和蛋白质数据银行(Protein Data Bank)中获取部分被破坏的输入结构,学习恢复正确的原子位置;模型中的图节点即为系统中的各个原子。PLACER能够根据小分子的原子组成和化学键信息,准确生成多种有机小分子的结构;在已知大分子蛋白质环境的前提下,可进一步构建出小分子及蛋白质侧链的结构,用于蛋白质-小分子对接。由于PLACER具有快速且随机的特性,可轻松生成大量预测结果,从而有效描绘构象异质性。在本文及其他研究中所描述的酶设计工作中,我们发现,利用PLACER评估设计活性位点的结构准确性与预组织程度,可显著提升设计成功率和催化活性;我们成功获得了一种预组织的逆醛缩酶,其kcat/KM值达到11,000 M⁻¹min⁻¹,远高于此前所有基于深度学习之前的酶设计成果。我们预计,PLACER将在快速生成小分子及其与蛋白质复合物的构象集合方面具有广泛的应用价值,并有望推动高活性预组织酶的设计。