中国科学院、AIを用いた新規プロテインエンジニアリング手法を開発 効率と汎用性向上でコスト削減も実現
中国科学家開発 新AIに基づく汎用的タンパク質工学手法 中国科学院遺伝・発生生物学研究所の高彩霞チームが、新しい人工知能(AI)を利用した汎用的タンパク質工学手法「AiCE」を開発しました。この方法は、既存の逆折りたたみモデルを使ってタンパク質の進化シミュレーションと機能設計を効率化し、専用のAIモデルの訓練には依存しません。 タンパク質工学とは、タンパク質のアミノ酸配列を人工的に変更して、その構造や機能を改良或いは変革する技術です。遺伝子組換え技術と比べて、タンパク質工学は直接タンパク質分子を操作することで、より迅速な機能最適化が可能ですが、多くの場合、経験に依存し、実験サイクルが長く、コストが高いことが課題となっています。 AiCEのコアとなるのは、「AiCEsingle」と「AiCEmulti」の2つのモジュールです。AiCEsingleは、既知のタンパク質3次元構造を基にして、逆折りたたみモデルの出力をサンプリングし、頻繁に出現するアミノ酸タイプを選定します。その後、構造的な制約を使って選別を行い、最終的に最も確実な単一アミノ酸置換候補を予測します。 テストでは、60個の深層突然変異スキャンデータを用いてAiCEsingleの性能を評価した結果、予測正確率は16%に達しました。これにより、構造制約の重要性が確認され、制約なしの手法よりも性能が37%高まったことが証明されました。また、他的一般AIモデルとの比較でも、AiCEsingleの性能は36%〜90%以上高かったです。AiCEsingleの対象は複雑なタンパク質やCRISPRタンパク質、SARS-CoV-2ウイルスタンパク質など、幅広い種類のタンパク質に対応しており、汎用性に優れています。 さらに、チームは、アミノ酸間の進化結合性を予測することで複数の突然変異の影響を推定する「AiCEmulti」モジュールも開発しました。6つの突然変異ライブラリの分析結果から、AiCEmultiは大規模タンパク質モデルSaProtと同等の予測性能を示し、計算コストは大幅に低いことが判明しました。 高彩霞チームは、これらのモジュールを組み合わせたAiCE方法を用いて、脱氨酵素、核局在化配列、核酸分解酵素、逆転写酵素等、多様な8種類のタンパク質の進化と機能改善を行いました。その結果、新しい塩基編集器を開発することができました。具体的には、高精度な新型シトシン塩基数編集器enABE8e、保真度を1.3倍向上させた新型アデニン塩基数編集器enSdd6-CBE、および活性を13倍向上させた新型ミトコンドリア塩基数編集器enDdd1-DdCBEの開発に成功しました。 これらの成果は、AIと構造・進化の制約を統合した逆折りたたみモデルが、既存のタンパク質工程手法に比して高い効率性、拡張性、汎用性を持つことを示しています。研究結果は7月7日、『セル』(Cell)誌に掲載されました。本研究は、農業農村部関連プロジェクト、国立自然科学基金、国家重点研究開発計画などの支援を受けました。