HyperAI

数十年にわたり、計算生物学は単一の GPU のメモリ容量に収めるため、複雑な生体分子システムを断片化して研究するという妥協を強いられてきました。このアプローチは、大型タンパク質や複合体をゼロショットで折りたたむ際の文脈欠如という課題を生んでいました。しかし、NVIDIA BioNeMo チームが開発した新しいコンテキスト並列化（CP）フレームワークが、このメモリ制限を打破し、システム全体を包括的にモデル化する道を開きました。従来の手法では、超大変なタンパク質を処理するために配列をスライスしてオーバーラップさせたり、モデル内部で断片化を行ったりしていましたが、これらは長距離相互作用やアロステリーといった重要な情報を失う欠点がありました。BioNeMo の CP 実装は、単一の巨大な分子システムを複数の GPU に分割シャードすることで、データ並列化とは異なり、一つのサンプルを跨いで処理します。このアーキテクチャは、N x N の行列をブロック状に分割し、各 GPU が特定のサブブロックのみを管理することでメモリ要件を劇的に削減します。さらに、計算と通信を非同期で重なるように最適化することで、システムのスケーラビリティを向上させました。具体的には、Boltz モデルを用いた実験で、256 個の GPU を使用して最大約 20,000 トークンの処理が可能となり、特に NVIDIA H100 や B300 グラフィックボード上で加速されました。その成果として、トレーニング時の最大クリップサイズを大幅に超える 3,605 残基からなる 4 本鎖の複合体も、4 つの H100 GPU で 5 分以内に正確に折りたたむことに成功し、すべての長距離相互作用を維持しました。この技術は、Rezo Therapeutics、Proxima、Earendil Labs といったパートナー企業とも連携し、6,500 残基に及ぶタンパク質間相互作用の予測や、創薬に必要な分子グロウの発見など、幅広い応用を実現しています。ただし、物理的な容量の拡大だけでは生物学的な精度は保証されず、長距離相互作用のロジックを正確に捉えるため、より大規模な断片サイズでのファインチューニングと、AlphaFold Protein Structure Database への高スループット予測データの貢献が不可欠です。NVIDIA の加速コンピューティングソフトを活用したこれらの進歩は、生体分子の構造解析と創薬プロセスに革命的な変化をもたらす可能性を秘めています。

関連リンク

関連リンク

関連リンク

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。

Command Palette

NVIDIA BioNeMo、コンテキスト並列で生体分子モデルをスケーリング

関連リンク

Command Palette

NVIDIA BioNeMo、コンテキスト並列で生体分子モデルをスケーリング

関連リンク

Command Palette

NVIDIA BioNeMo、コンテキスト並列で生体分子モデルをスケーリング

関連リンク

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。

オンラインチュートリアル | UC Berkeley/NVIDIAなどが、GPUメモリを4倍節約し、トレーニング時間を10%短縮するオープンソースの3DGSライブラリgsplatをリリースしました。