OpenFold3が公開:全構造予測対応のオープンソースAIモデルで蛋白質・核酸・薬物の構造予測が革新
OpenFoldコンソーシアムは、タンパク質や核酸、ドラッグ分子の三次元構造を高精度に予測できるオープンソースの基礎モデル「OpenFold3」のプレビュー版を公開した。このモデルは、実験的に決定された30万以上の構造データと、コンソーシアムが独自に構築した1300万以上の合成データを活用して学習され、タンパク質がどのように折りたたまれるかをアミノ酸配列のみから予測できる。特に、タンパク質と小分子リガンドや核酸の相互作用を正確にモデル化できる点が特徴で、市場に上市されているドラッグの多くがこれらの相互作用を介しているため、医薬品開発への応用が期待される。 OpenFold3は、アパッチ2.0ライセンスで公開されており、研究機関や企業を問わず、モデルの利用、再訓練、応用開発が自由に行える。これは、DeepMindのAlphaFold3が一部の学術利用に限定されているのに対し、OpenFold3は産業界での活用も可能という点で大きな違いである。開発はコロンビア大学のAlQuraishi研究室、ローレンスリバモア国立研究所のBioresilienceプログラム、ソウル国立大学のSteinegger研究室らが主導し、バイオテック・製薬・材料科学など幅広い分野での活用が進んでいる。 Novo NordiskやBayer Crop Science、Outpace Bio、Cyrus Biotechnologyなど主要企業が、OpenFold3を自社の研究開発プロセスに組み込み、新薬や農業用分子の設計を加速している。特に、タンパク質とドラッグの結合構造を予測できることで、ターゲット選定や分子設計の精度が向上し、臨床での患者層分類にも寄与する。 技術的にはPyTorchで構築され、NVIDIA NIMを介した高速推論が可能。モジュール構造により、ユーザーが自身のデータ形式に合わせてモデルを調整できるため、データサイエンティストやITチームの負担を軽減。さらに、英国政府主導の「OpenBind」や複数の大手製薬企業によるプライベートデータでの微調整プロジェクトなど、オープンな生態系が急速に広がっている。 コンソーシアムの目標は、Linuxが情報技術分野で標準となったように、OpenFoldを生物学分野の基盤技術にすること。AWSやSandboxAQなどの企業も支援に参加し、AIによる生命科学の革新を推進している。OpenFold3のコードやモデルはGitHub、Hugging Face、Tamarind Bio、Apherisを通じて公開されており、誰もがアクセス可能。これは、AIによる生物学研究の民主化を実現する重要な一歩と評価されている。
