HyperAI超神经
Back to Headlines

NVIDIA 新一代 Blackwell 架构大幅提升 AI 推理效率,助力全球生产力跃升

6 days ago

当你向生成式人工智能(AI)发出指令,无论是回答问题还是创建图像,大型语言模型都会生成一系列智力单元(称为“token”),这些单元组合起来形成最终的结果。这被称为AI推理。然而,当提到代理型AI(Agentic AI),情况就不同了。代理型AI通过逻辑推理完成任务,它不仅仅提供一次性答案,而是将任务分解为多个步骤,每个步骤都涉及不同的推理技术。 为了实现最佳的AI推理效果,AI工厂需要平衡两个关键因素:单用户的处理速度和整个系统的吞吐量。随着用户数量的增长,提高这些因素的表现意味着增加更多的浮点运算每秒(FLOPS)和更高的带宽。这意味着AI工厂可以更有效地处理和分配工作负载,从而最大化生产力。但最终,这一切都受限于可获取的电力资源。 以一个1兆瓦的AI工厂为例,英伟达的Hopper架构在最大负荷下每秒可以生成180,000个token,而对单个用户来说,最快可达每秒225个token。但这只是冰山一角。实际操作中,AI工厂会在不同的性能需求下处理不同批次的工作负载,NVIDIA的GPU因其可以通过CUDA软件编程而能灵活处理各种类型的工作负载。 NVIDIA的新Blackwell架构在相同功率下表现出更大的潜力。通过优化软硬件堆栈,Blackwell能随着时间推移变得更快、更高效。此外,NVIDIA推出了一种新的操作系统Dynamo,它能自动优化AI工厂的工作负载,将推理任务拆分为更小的组件,并动态地将工作负载路由到当前最优化的计算资源上。这一改进非常显著,从Hopper到Blackwell的一次架构升级就能在同一能量消耗下带来50倍的AI推理性能提升。 NVIDIA通过不断优化硬件和软件、计算能力和网络性能,推动这一曲线向外扩展。每一次性能的提升,都在为NVIDIA的全球合作伙伴和客户创造数百亿美元的生产力,同时也让我们离治愈疾病、逆转气候变化和揭示宇宙的最大奥秘更近一步。计算能力正在转化为资本,推动着人类的进步。 业内专家表示,NVIDIA在AI硬件和软件的全栈整合方面处于领先地位,这使得他们能够在芯片架构代际之间为客户带来巨大的性能和效率提升。随着技术的不断发展,NVIDIA不仅提升了自身产品的竞争力,也为整个AI行业设立了新的标杆。英伟达作为全球领先的图形处理和AI计算解决方案提供商,其技术创新一直走在行业的前沿。

Related Links