人類の病気との長い闘いの中で、医薬品の研究開発は常に科学的探求の最前線にありました。中でも低分子医薬品は、調製の容易さ、細胞透過性の強さ、経口投与の利便性、製造コストの低さなどの利点から、医薬品の研究開発の主力となっています。深い疎水性ポケット。科学の進歩により、大環状分子はその独特な三次元構造と高い親和性により、従来の小分子薬では到達することが困難な分子標的を調節することができ、それらの「創薬不可能な」タンパク質に新たな治療の可能性をもたらします。
しかし、従来の医薬品開発は天然物の発見やハイスループットスクリーニング技術に依存しており、時間とコストがかかります。AI の開発は医薬品設計に新たなブレークスルーをもたらしました。最近、優れた計算生物学者であり、2024 年ノーベル化学賞を受賞したワシントンタンパク質研究所所長であるデイビッド・ベイカー氏のチームは、革新的な拡散モデルベースの技術である RF ペプチドを開発しました。これは、さまざまな物質に対する高親和性ペプチドを設計するために使用されます。タンパク質ターゲットの大環状ペプチドコンジュゲート。
具体的には、この技術は、修正された RoseTTAFold とループ相対位置エンコーディングを備えた RFdiffusion を利用して正確な大環状骨格を生成し、ProteinMPNN と Rosetta Relax を統合して配列を最適化し、医薬品開発および診断技術のための標的を絞った効率的な大環状設計を可能にします。この研究は「深層学習を使用した高親和性タンパク質結合大環状化合物の正確なデノボ設計」と題され、bioRxiv でプレプリントとして公開されました。
研究のハイライト:
* RFpeptides は、α ヘリックス、β シート、環構造などのさまざまな二次構造を持つ大環状分子の設計を専門とし、特定のタンパク質界面に合わせてカスタマイズして、治療および診断の応用を推進します。
* MCL1、MDM2、GABARAP、および RbtA をターゲットとする RF ペプチドによって設計された大環状分子はすべて高い結合親和性を示します
* RFペプチドにより、構造が解明されていないタンパク質に対するde novoバインダーの設計が可能となり、未解明のタンパク質や構造的に特徴づけられていないタンパク質を標的とするタンパク質設計のルールが変わります。
用紙のアドレス:
https://doi.org/10.1101/2024.11.18.622547
公式アカウントをフォローし、バックグラウンドで「Dahuan Design」に返信すると全文PDFが入手できます
オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、大規模なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s
大環状複合体のde novo設計研究において、研究チームは、抗がん治療において重要な役割を果たすMCL1を最初の標的タンパク質として選択した。この研究では、RFペプチド技術を使用して9,965の多様な環状ペプチド骨格を生成し、ProteinMPNNおよびRosetta Relax設計プロセスを通じて各骨格の4つのアミノ酸配列を設計しました。深層学習と物理的基本指標に基づくスクリーニングの後、実験的特性評価のために最終的に 27 の設計が選択されました。
この研究では、腫瘍抑制タンパク質 p53 と相互作用する MDM2 も標的としました。1 万個の大環状骨格が生成され、各骨格に対して 4 つのアミノ酸配列が設計されました。 AfCycDesign によって予測された 40,000 の設計のうち、7,495 が MDM2 で効果的であると考えられました。
GABARAPの大環状化合物を設計する際には、研究チームは6つのホットスポット残基を定義し、2万個の大環状骨格を生成し、アミノ酸配列を設計した。 80,000 のデザインの中から、335 の大環状デザインが研究のために選択されました。
RbtA の場合、研究チームはAF2とRF2を使用してその構造を予測し、7つのホットスポット残基を定義し、20,000のバックボーンを生成し、各バックボーンに4つのアミノ酸配列を設計しました。このプロセスでは、反復的な ProteinMPNN と Rosetta Relax が設計プロセスで使用されました。
RFペプチドにより、ターゲットを絞った効率的な大環状設計が可能になります。具体的には、サイクル相対位置エンコーディングを備えた改変RoseTTAFoldとRFdiffusionを使用して、正確な大環状骨格を生成し、配列最適化のためにProteinMPNNとRosetta Relaxが統合されています。
RFペプチド:RoseTTAFold2とRFdiffusionに基づくさらなる拡張
この研究ではまず、RoseTTAFold2 (RF2) 構造予測ネットワークの既知の環状ペプチド構造のモデル化能力を評価しました。以下の図 A に示すように、研究者らはループ相対位置エンコード機構を導入することで RF2 に重要な改良を加え、そのロバストな自然予測が可能であることを観察しました。環状ペプチド構造が得られます。
この成功を考慮して、研究者らは、ループ相対位置エンコーディングにより、同様のネットワーク アーキテクチャにより RF 拡散による大環状ペプチド構造の生成も可能になるのではないかと推論しました。したがって、上の図 BC に示すように、この研究では RF 拡散にループ相対位置エンコーディングを追加し、多様な大環状ペプチドの堅牢な生成を観察することに成功しました。
ループの伝達可能な相対位置エンコーディングに触発されて、研究チームは RF 拡散を使用して de novo タンパク質結合マクロループを設計し始めました。以下の図 D に示すように、この研究では、RF 拡散タンパク質設計パイプラインで循環相対位置エンコーディングを使用して、生成されたチェーンのエンコーディングを提供します。次に、以下の図 E に示すように、ProteinMPNN を使用して大環状骨格に一致するアミノ酸配列を設計し、RF ペプチドの構築を完了します。以下の図 F に示すように、 RFペプチドは、標的タンパク質の多様な二次構造を持つ大環状化合物を迅速に生成できます。
大環状化合物: 洗練されたスクリーニングのための RF ペプチドに基づいた製品の設計
RFペプチドを使用してさまざまな標的に対して多様な大環状化合物骨格を生成した後、研究では引き続きProteinMPNNとRosetta Relaxを使用して、生成されたバックボーンに局所的な変更を加え、アミノ酸配列の多様性を取得しました。
まず、iPAE、モデル類似性評価、RF2 支援スクリーニングに基づいて、研究者らは AfCycDesign を使用して、大環状配列と標的構造をテンプレートとして使用して設計されたタンパク質-大環状複合体を再予測し、高い信頼性で設計を選択しました。
次に、この研究では、Rosetta を使用して、設計された大環状分子の結合親和性 (ddG)、空間凝集傾向 (SAP)、界面接触分子表面積 (CMS) などの品質指標を計算し、候補を絞り込みました。
最後に、研究者らはスクリーニングされた少数の設計を選択し、化学合成と生化学的特性評価を通じて実験で結合親和性を決定し、比較検証を行って設計の精度と有効性を確認しました。
MCL1 および MDM2 を標的とする大環状化合物の設計と特性評価
RFペプチドの有効性を検証するために、研究者らはまず骨髄性細胞白血病タンパク質1(MCL1)を最初の標的タンパク質として選択し、実験的特性評価を実施した。以下の図 AB に示すように、研究者らは、MCB_D2 (紫色) が MCL1 (灰色の表面) に最も強く結合し、2μM の結合親和性を示すことを発見しました。
大環状分子が設計された方法で結合しているかどうかを確認するために、研究者らは、MCL1に結合したMCB_D2のX線結晶構造を決定した。以下の図 C に示すように、結晶構造は設計モデルとほぼ同一であり、Cα RMSD は 0.7 Å です。以下の図 D に示すように、大環状分子が結晶構造と重なっている場合、Cα RMSD は 0.4 Å であり、結晶構造内の相互作用する残基の側鎖立体配座も設計モデルに非常に近くなっています。さらなる結晶構造分析では、図 E および F から、MCB_D2 のループ領域が MCL1 と疎水性接触および陽イオン - π 相互作用を持っていることも明らかになりました。
MCL1 の環状分子への結合の実験的検証に触発されて、研究チームは MDM2 複合体の設計に着手しました。以下のGIに示すように、研究者らは、MDB_D8 が MDM2 にとって最適な大環状分子であり、1.9μM の高い親和性を示すことを発見しました。さらに、計算モデルによって予測された界面の主要な接触点は、天然の MDM2-p53 複合体の構造で観察される相互作用との類似性を示します。
GABARAP 用の大環状化合物の設計と特性評価
RFペプチドをさらに分析するために、研究者らは次に、MCL1およびMDM2の構造とは完全に異なる結合部位を持つ化合物、つまりガンマアミノ酪酸A型受容体関連タンパク質(GABARAP)を設計した。
実験結果は、以下の図 AB および DE に示すように、GAB_D8 と GAB_D23 は両方とも GABARAP の有効な化合物であり、それぞれ 6nM と 36nM の親和性を示します。GAB_D8 はこれまでに発見された GABARAP の最も有効な大環状化合物です。以下の図CおよびFに示すように、X線結晶構造解析により、GAB_D8-GABARAPL1複合体の構造は設計モデルと非常に一致しており、GAB_D23およびGABARAPの複合体構造も設計モデルと非常に一致していることがわかりました。これにより、設計モデルの重要な相互作用の精度が検証されます。
一部の領域では設計モデルと結晶構造の間にわずかな違いがありますが、多重配列アラインメント (MSA) に基づく予測は X 線結晶構造とのより高い一致を示しています。以下の GI に示すように、これらの小さな違いにもかかわらず、MSA によって予測された結果は、実験的に得られた結晶構造とさらに一致しています。
構造未知の大環状化合物 RbtA の設計と特性評価
この研究はまた、RFペプチドが設計リスクを効果的に低減できるかどうかを推測するために、未知の実験構造を持つ標的タンパク質をターゲットとする大環状化合物の設計にも着手した。 RbtA を例にとると、研究者は最初に AF2 と RF2 を使用してそのタンパク質構造を予測し、2 つの方法で同様の全体構造を予測しました。これに基づいて、研究者らは、AF2およびRF2とほぼ同一であると予測される領域を設計するためにRFペプチドを使用することを選択した。結果は、以下の図 AB に示すように、RBB_D10 は RbtA の強力な大環状分子であり、9.4nM の結合親和性を示します。
RbtAとRBB_D10の間の結合モードを確認するために、研究者らはRbtAに結合したアポの高分解能X線結晶構造をさらに分析した。上の図 C に示すように、X線結晶構造解析により、アポ構造と予測構造(RMSD 1.2Åおよび1.1Å)が高度に一致していること、また上記の図Dに示す複雑な構造が設計モデル(RMSD 1.4)とほぼ正確に一致していることが確認されました。 Å)。上の図 4E-H に示すように、大環状化合物の X 線構造は設計モデル (RMSD 0.4Å) とほぼ一致しており、設計モデルの精度が検証されています。
ノーベル化学賞の重鎮受賞者であるデビッド・ベイカーの名前は、間違いなくタンパク質研究の分野で響き渡るシンボルです。 David Baker は、人工知能によるタンパク質構造予測の重要人物の 1 人として、タンパク質構造予測の進歩を大きく推進しただけでなく、タンパク質設計の分野でも実りある成果を上げました。
2003 年にはすでに、David Baker のチームは、自然由来ではない初の新しいタンパク質である Top7 を設計しました。この成果は科学界を驚かせただけでなく、デノボタンパク質設計の分野において人類にとって重要な進歩を表しました。
原紙:10.1126/science.1089427
Top7のデザインは目を引きますが、それは特定の構造に基づいたデザインに過ぎず、実際の機能を備えているわけではありません。 David Baker 氏と彼のチームはそこで止まらず、タンパク質のエネルギーを計算する関数、さまざまなバックボーンと側鎖のサンプリング方法、モンテカルロ シミュレーションや連続最適化方法などのグローバル最適化アルゴリズムを含む、さまざまな計算方法を試して研究を続けました。
生成 AI および機械学習技術の発展により、特定の生物学的機能を持つ新しいタンパク質を設計することが徐々に可能になりつつあります。 2024 年 6 月、デビッド ベイカーのチームは新たな環状タンパク質を設計しました。線維芽細胞成長因子 (FGF) シグナル伝達経路を調節し、血管分化を促進します。この研究は、de novo タンパク質設計の適用範囲を広げるだけでなく、この分野の発展に大きな影響を与える可能性があります。
原紙:
https://www.cell.com/cell/fulltext/S0092-8674(24)00534-8
デビッド・ベイカーの研究は、タンパク質設計分野の発展を大きく促進しました。タンパク質をゼロから設計するという彼の画期的な進歩は、私たちが新しい時代、つまり人間が生命の基本的な構成要素を正確に制御できる時代の入り口に立っていることを示しています。これらの技術の開発と応用により、一連の地球規模の課題が解決されることが期待されています。