1 个月前
La-Proteina:通过部分潜在流匹配生成原子级蛋白质
Tomas Geffner, Kieran Didi, Zhonglin Cao, Danny Reidenbach, Zuobai Zhang, Christian Dallago, Emine Kucukbenli, Karsten Kreis, Arash Vahdat

摘要
最近,许多用于从头设计蛋白质结构的生成模型相继涌现。然而,只有少数模型直接生成与底层氨基酸序列联合的全原子结构。这一任务极具挑战性,例如,模型必须在生成过程中处理长度变化的侧链。我们引入了一种基于新型部分隐式蛋白质表示的全原子蛋白质设计方法——La-Proteina:粗略主链结构被显式建模,而序列和原子细节则通过每个残基的固定维度隐变量来捕捉,从而有效地规避了显式侧链表示带来的挑战。在这种部分隐式空间中进行流匹配,则可以对序列和全原子结构的联合分布进行建模。通过详细的结构分析和评估确认,La-Proteina在多个生成基准测试中表现出色,包括全原子共设计性、多样性和结构有效性。值得注意的是,La-Proteina在原子基序支架性能方面也超过了以往的模型,为关键的原子结构条件下的蛋白质设计任务打开了大门。此外,La-Proteina能够生成多达800个残基的可共设计蛋白质,在大多数基准模型失效且无法产生有效样本的情况下,展示了其良好的可扩展性和鲁棒性。