オンラインチュートリアル | コンピューティング能力のコストが急落!Apple がストリームマッチングに基づくタンパク質フォールディングモデル「Ml-simplefold」をリリース。

特色图像

2025年9月、Appleは軽量なタンパク質フォールディング予測AIモデル「Ml-simplefold」をリリースしました。フローマッチングに基づく最初のタンパク質フォールディングモデルとして、CAMEO22やCASP14などの権威あるベンチマークでテストされています。計算コストを削減した後でも、SimpleFold は AlphaFold2 や RoseTTAFold2 などのトップ モデルに匹敵するパフォーマンスを示します。同時に、小型版の SimpleFold-100M も競争力のあるパフォーマンスを発揮します。

従来のタンパク質フォールディングモデルは優れた精度を誇るものの、多数のドメイン固有のアーキテクチャ設計と手作業で構築された特徴量に依存しています。これらのモデルでは、一般的に用いられる三角形更新モジュール、明示的なペア表現メカニズム、そして複数の学習目標が、学習の計算コストを増大させます。さらに、アーキテクチャとハードウェアはスケーラビリティに欠けており、多様な構造の生成やアンサンブル予測をサポートすることが困難です。

伝統的な方法の一般的な欠陥を狙って、SimpleFold は、タンパク質折り畳みモデルの複雑なアーキテクチャへの依存を打破し、Transformer のみに基づいた一般的な生成フレームワークを提案します。

* Flow Matching 技術に基づき、多重配列アライメント (MSA) などの複雑なモジュールをスキップし、ランダムノイズからタンパク質の 3 次元構造を直接生成することで、計算コストを大幅に削減します。

* 三角形の更新やペア表現などの特定のモジュールを廃止し、標準のTransformerのみを使用し、適応レイヤーを通じて構造認識を強化する汎用アーキテクチャを採用します。

* 構造制約を追加することで、タンパク質の3次元構造を生成する際のモデルの柔軟性と物理的一貫性が向上します。900万個の構造データで学習した3Bパラメータモデルは、コンシューマーグレードのハードウェアでもスムーズに動作し、計算負荷を大幅に低減します。

「Ml-simplefold:軽量タンパク質フォールディング予測AIモデル」が、HyperAI Hyperneuronウェブサイト(hyper.ai)の「チュートリアル」セクションで公開されました。ワンクリックで実行して、最新のタンパク質生成ツールをお試しください。

チュートリアルリンク:

https://go.hyper.ai/cppGG

デモの実行

  1. ブラウザにhyper.aiのURLを入力してください。ホームページにアクセスしたら、「チュートリアル」ページをクリックし、「フローマッチングに基づくタンパク質フォールディングモデル」を選択して、「このチュートリアルをオンラインで実行」をクリックしてください。
  1. ページがジャンプしたら、右上隅の「複製」をクリックして、チュートリアルを独自のコンテナーに複製します。
  1. 「NVIDIA RTX A6000 48GB」と「PyTorch」のイメージを選択し、「続行」をクリックしてください。OpenBayesプラットフォームでは、従量課金制、日単位/週単位/月単位の4つの課金オプションをご用意しています。新規ユーザーは、以下の招待リンクから登録すると、RTX 4090を4時間分、CPU時間を5時間分無料でご利用いただけます。

HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーして開きます):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. リソースが割り当てられるのを待ちます。最初のクローン作成には約2分かかります。ステータスが「実行中」に変わったら、「ワークスペースを開く」をクリックしてデモページに移動します。

効果実証

以下はMl-simplefoldの使用ページです。「README」をクリックすると生成インターフェースにジャンプします。

対応する領域にアミノ酸パラメータの説明を入力し、「実行」をクリックすると、予測されたタンパク質ファイル、全原子構造、および GT 構造と結合された 3D 視覚化画像が取得されます。

以上が今回HyperAIがおすすめするチュートリアルです。ぜひ皆さんも体験してみてください!

チュートリアルのリンク:

https://hyper.ai/cn/tutorials/44955