HyperAI超神経
17日前

サイドチェーンの条件付けとモデリングを用いたFAMPNNによる全原子プロテインシーケンス設計

Talal Widatalla, Richard W. Shuai, Brian Hie, Possu Huang
サイドチェーンの条件付けとモデリングを用いたFAMPNNによる全原子プロテインシーケンス設計
要約

固定バックボーンに基づくプロテインシーケンス設計の最先端のディープラーニング手法は、シーケンス生成中にプロテインのサイドチェーン構造をモデル化しない儘、サイドチェーン原子の三次元配置がプロテインの構造、安定性、および全体的な機能に大きな役割を果たすにもかかわらずです。これらのモデルは、バックボーンの幾何学とアミノ酸シーケンスのみに基づいて重要なサイドチェーン相互作用を暗黙的に推論します。この問題に対処するため、私たちはFAMPNN(Full-Atom MPNN)を提案します。これは、各残基のシーケンス同一性とサイドチェーン構造を明示的にモデル化するシーケンス設計手法であり、各トークンの離散的なアミノ酸同一性と連続的なサイドチェーン構造の分布は、カテゴリカルクロスエントロピー損失と拡散損失を組み合わせた目的関数で学習されます。私たちは、これらの分布を共同で学習することが非常に相乗効果のあるタスクであることを示し、シーケンス回復の改善だけでなく最先端のサイドチェーンパッキングも達成しています。さらに、明示的な全原子モデリングによる利点は、実験的結合および安定性測定値のゼロショット予測などの実用的なプロテイン設計アプリケーションにまで一般化されています。