NVIDIA 推出Exemplar Clouds计划,助力 AI 开发者精准评估云基础设施性能
NVIDIA 正式推出了 NVIDIA Exemplar Clouds 项目,旨在解决开发者和企业在云上训练大型语言模型(LLMs)和部署人工智能工作任务时面临的性能、可靠性和成本效率问题。长期以来,云平台上存在理论峰值性能与实际运行效果之间的巨大差异,这种不透明和不确定使得企业和开发团队难以做出合适的基础设施选择。 为了提升透明度、标准度和可比性,NVIDIA 通过其云合作伙伴生态系统(NCP)启动了这一新项目。NCP 是专门构建在最新 NVIDIA GPU 架构和软件栈之上的云服务提供商。此前,这些平台是否针对真实世界 AI 工作负载进行了优化,或者是否有足够的韧性支持高效率开发,都没有标准化或公开的验证方式。NVIDIA Exemplar Clouds 解决了这一问题,建立了一个评估框架,从真实性能、韧性等多个维度对云服务商进行考核。 参与此项目的云服务商需要通过一系列基于开放标准、针对不同工作负载的基准测试,涵盖推理、微调和大规模预训练等方面。合格的服务商将获得 Exemplar 认证,这不仅能让客户基于性能和总拥有成本(TCO)做出更明智的选择,还能推动各家 NCP 不断优化自己的平台和服务。 NVIDIA 还通过其 NVIDIA DGX Cloud Benchmarking 提供详细的基准测试配方和结果,使开发者、研究人员和企业能够清楚地了解每个服务商的基础设施表现,从而更加有信心地进行部署。作为 NVIDIA Exemplar Clouds 项目的首个亚太区成员,Yotta 云服务商凭借其在各种高要求 AI 工作负载中的稳定高性能,获得了认证。NVIDIA 团队将在接下来的几个月中与 Yotta 合作,进一步优化用户体验、性能和弹性。通过这个项目,Yotta 的客户可以获得详细的基准测试数据,明确了解各自的基础设施如何应对不同的使用场景,并确信工作负载能够按预期运行,无需猜测和惊喜。 NVIDIA 创始人兼 CEO 黄仁勋表示,NVIDIA Exemplar Clouds 项目将为广大用户提供世界一流的 AI 基础设施。在主权 AI 发展背景下,这一项目有望为整个行业树立新的透明度和性能标准,帮助全球各规模的用户更快、更可靠地构建和部署 AI 应用。 对于想要优化 AI 工作负载的企业和个人,可以通过探索 NVIDIA DGX Cloud Benchmarking 获取更多信息和支持。若想了解详情,可以参加 2025 年的 COMPUTEX 大会,听取黄仁勋的主题演讲,或关注同期举行的 GTC 台北分会场相关活动。 业内人士认为,NVIDIA Exemplar Clouds 项目不仅是对现有云服务商的重要改进,也为新兴 AI 云服务商设定了高起点。NVIDIA 作为全球领先的计算平台公司,以其强大的技术支持和严格的标准体系,有望显著提升整个行业的服务质量和技术水平,促进 AI 领域的快速发展。