ラッソペプチド専用AIモデル「LassoESM」開発、構造予測と機能設計を飛躍的に加速
細菌が生産する「ラッソペプチド」は、独特のスリップノット構造により高い安定性と多様な生物学的活性を示し、がんや感染症の治療薬開発に注目されている。しかし、その構造の特殊性から、従来のAIモデルでは正確な構造予測が困難だった。この課題を解決するため、ウイスコンシン大学とイリノイ大学の研究チームが、ラッソペプチド専用の言語モデル「LassoESM」を開発した。このモデルは、大規模な蛋白質言語モデル「ESM-2」を基盤に、ラッソペプチドのデータを用いてドメイン適応型のマスク言語モデルで再学習されたもので、自然に形成されるラッソ構造の「言語」を学習した。 研究チームは、微生物由来の数千のラッソペプチド配列をバイオインフォマティクスで収集し、実験的に検証されたデータを用いて品質を高めた。その後、部分的なアミノ酸配列を隠して残りを予測する手法でモデルを訓練。その結果、ラッソサイクラーゼとペプチドの適合性、酵素の基質耐容性、RNAポリメラーゼ阻害活性の予測が可能になった。特に、異なるペプチドとサイクラーゼの非同種組み合わせでも、結合可能性を予測できる点が画期的だ。 研究リーダーのドゥーグ・ミッチェル氏は、「ラッソペプチドは受容体標的や経口投与可能な薬剤としての可能性が非常に高い」と語り、LassoESMが新薬開発の効率を飛躍的に高める可能性を強調した。共同リーダーのディワカール・シュクラ教授も、「従来のAIでは捉えきれない特異な性質を、このモデルが捉えることができる」と評価。特に、特定のペプチドにラッソ構造を付与できるよう、サイクラーゼを設計・改変する基盤としての価値が高い。 この成果は、Nature Communicationsに2025年1月に掲載された。今後は、他のペプチド天然物向けのモデル拡張や、特定タンパク質を標的とするラッソペプチドの設計にも応用される予定。研究は、カール・R・ウーズ研究所の多分野連携体制と強力な計算リソースを背景に実現された。
