NVIDIA 利用上下文并行技术扩展生物分子建模
NVIDIA BioNeMo 团队推出了名为上下文并行(Context Parallelism, CP)的新框架,旨在突破计算生物学长期面临的单卡显存限制。长期以来,受限于硬件内存,研究人员不得不将大型生物分子系统切割成孤立片段进行分析,导致丢失了关键的全局结构信息,无法零样本折叠大型蛋白复合物。CP 框架通过跨多卡切片单个分子系统,实现了对庞大生物系统的整体建模。 该框架基于 Torch 分布式 API 构建,采用多维切片策略,将原本随分子规模平方增长的内存占用降低为线性比例。具体技术包括将全局矩阵分块处理、利用重叠计算与通信机制优化效率,以及针对原子序列注意力机制进行分布式优化。通过这种设计,系统不再依赖传统的串行或数据并行,而是让单个样本分散在不同 GPU 上协同运算,确保全局状态不被切断。 实测数据显示,Boltz 模型借助 CP 框架在 256 张 H100 卡上成功预测了长达 20,000 个 token 的分子结构。团队在没有额外微调的情况下,仅用四张 H100 卡便在五分钟内完成了包含 3605 个残基的四链复合物折叠,准确保留了长距离亚基接触信息。此外,Rezo Therapeutics、Proxima 和 Earendil Labs 等合作伙伴也已应用该技术,分别实现了 6500 和 4000 残基级别的高精度预测,显著缩短了新型药物和生物制剂的发现周期。 尽管 CP 突破了物理内存瓶颈,但研究人员指出,模型训练数据的缺乏仍是高保真折叠的障碍。未来将结合高通量计算工具补充大规模复合物数据,以支持更大型生物系统的基础模型训练。这一进展标志着计算生物学正式迈入处理全尺度分子系统的新时代。
