1ヶ月前
La-Proteina: 部分潜在フローマッチングを用いた原子レベルのタンパク質生成
Tomas Geffner, Kieran Didi, Zhonglin Cao, Danny Reidenbach, Zuobai Zhang, Christian Dallago, Emine Kucukbenli, Karsten Kreis, Arash Vahdat

要約
最近、de novoタンパク質構造設計のための生成モデルが多数登場しています。しかし、アミノ酸配列と完全な原子レベルの構造を直接同時に生成するという難しい課題に取り組んでいるものはまだ少ないです。これは、例えば、モデルが生成中に長さが変化する側鎖について推論しなければならないため、挑戦的です。私たちは新しい部分的に潜在的なタンパク質表現に基づく原子レベルのタンパク質設計手法であるLa-Proteinaを導入します。この手法では、粗い主鎖構造は明示的にモデリングされ、配列と原子詳細は固定次元の残基ごとの潜在変数によって捉えられます。これにより、明示的な側鎖表現の課題を効果的に回避できます。この部分的に潜在的な空間でのフローマッチングにより、配列と全原子構造の同時分布がモデリングされます。詳細な構造解析と評価を通じて確認されたように、La-Proteinaは全原子共設計可能性、多様性、および構造的妥当性などの複数の生成ベンチマークで最先端の性能を達成しています。特に、La-Proteinaは原子モチーフスキャフォールディング性能においても従来のモデルを上回り、重要な原子構造条件付きタンパク質設計タスクへの道を開きました。さらに、La-Proteinaは最大800残基までの共設計可能なタンパク質を生成できることを示しており、これは多くのベースラインが有効なサンプルを生成できない領域であり、La-Proteinaのスケーラビリティと堅牢性を証明しています。