Hugging Face 携手 NVIDIA 推出 Training Cluster as a Service,加速全球 AI 研究进展
今天在巴黎的图形技术大会(GTC)上,Hugging Face 和 NVIDIA 共同宣布推出“训练集群即服务”(Training Cluster as a Service)。这一新合作旨在为全球的研究组织提供更便捷的大型 GPU 集群访问路径,从而加速各大领域基础模型的训练和发展。 使 GPU 集群更加普及 许多大型 GPU 超级集群项目正在兴建,以满足下一代人工智能模型的训练需求。然而,这些项目往往集中在少数拥有丰富计算资源的机构手中,导致“GPU 贫乏”与“GPU 富裕”之间的差距迅速扩大。尽管如此,超大规模云服务商、区域性和人工智能原生的云提供商都在快速扩展其 GPU 容量。那么,如何将这些计算能力连接到需要它们的研究人员?如何让全球的大学、国家研究实验室和企业能够构建自己的模型?这就是 Hugging Face 和 NVIDIA 推出“训练集群即服务”的初衷——提供灵活的 GPU 集群访问和按需付费的模式。 如何使用 任何注册在 Hugging Face 平台上的组织(目前已有约 25 万个)都可以通过 hf.co/training-cluster 页面请求所需的 GPU 集群大小和使用时间。一旦申请被接受,Hugging Face 和 NVIDIA 将合作完成 GPU 集群的采购、定价、配置和设置,满足用户在规模、区域和时长上的具体需求。 实际应用案例 推进罕见遗传疾病研究的 TIGEM TIGEM(Telethon Institute of Genomics and Medicine)是一个致力于理解罕见遗传疾病分子机制并开发新型治疗方法的研究中心。该中心的 Diego di Bernardo 博士表示,训练新的 AI 模型可以预测致病变异的影响,并帮助药物重新定位。“训练集群即服务”简化了他们获取所需 GPU 资源的流程,使研究工作更容易推进。 推动数学 AI 进步的 Numina Numina 是一个非营利组织,专注于开发开源数学推理 AI 和开放数据集。Yann Fleureau 是该项目的联合创始人之一,他表示计算资源是目前发展的瓶颈。“训练集群即服务”将帮助 Numina 达到其构建开放替代顶级闭源模型(如 DeepMind 的 AlphaProof)的目标。 镜像物理:前沿材料科学研究 Mirror Physics 是一家初创公司,致力于开发化学和材料科学的前沿 AI 系统。该公司 CEO Sam Walton Norwood 表示,借助“训练集群即服务”,他们能够在前所未有的规模上生产高保真化学模型,这将是材料科学领域的一大飞跃。 助力多样化的 AI 研究 Hugging Face 和 NVIDIA 的共同目标是让更多研究人员和公司能够轻松获得高性能计算资源,从而推动各个领域和语言中的下一代 AI 模型的发展。Hugging Face 的联合创始人兼 CEO Clément Delangue 强调,大规模、高性能的计算资源对于构建先进的 AI 模型至关重要,“训练集群即服务”将为研究人员和公司打破这些壁垒,开启更多可能性。 NVIDIA 的 DGX Cloud Lepton 与 Hugging Face 的“训练集群即服务”集成,为开发者和研究人员提供了一个无缝接入 NVIDIA GPU 的方式。这一合作不仅使得 AI 研究者和组织能够更轻松地扩展训练工作负载,还可以继续使用他们熟悉的工具。NVIDIA 的 DGX Cloud 副总裁 Alexis Bjorlin 认为这是对 AI 社区的一次重大贡献。 业内人士认为,“训练集群即服务”将极大地促进全球 AI 研究的多样化发展,尤其是在资源有限的小型研究团队中。这一合作不仅有助于推动技术创新和模型优化,还为全球范围内的学术和工业界提供了更多机会。Hugging Face 作为一个领先的自然语言处理开源平台,与 NVIDIA 的深度合作将进一步巩固其在 AI 生态系统中的领导地位。
