HyperAI超神经
Back to Headlines

英伟达的AI工厂神话破灭:推理市场暴露毛利率真相与基础设施瓶颈

2 days ago

在2025年6月25日的VB Transform 2025大会上,Groq公司的首席执行官Jonathan Ross和Cerebras公司的首席技术官Sean Lie直接挑战了Nvidia关于AI推理市场主导地位的叙述。这场对话揭示了一个根本性的矛盾:如果AI推理是一条标准化的生产流水线,为什么其毛利率仍能高达70%? Ross直言不讳地批评Nvidia的“AI工厂”概念:“这是个营销手段,让AI听起来不那么吓人。”而Lie则指出,Nvidia似乎乐得见服务提供商们为争夺每一分钱而争斗,自己却坐享其成。“Nvidia坐在那里,舒服地享受70%的毛利。”他说道。 随着数百亿美元的投资注入基础设施建设,以及企业AI架构的未来走向成为焦点,这两位芯片制造商的领导人披露了一些令人不安的事实。当前,许多大型企业正在与OpenAI等模型供应商进行每周的谈判,争取更多计算资源的分配权限。然而,这些企业在追求AI项目时屡屡受挫,因为基础设施无法实现指数级扩展。 Dylan Patel是SemiAnalysis的创始人,他在会上详细解释了基础设施面临的挑战:“即使企业愿意支付更高的费用,也无法在短时间内获得所需的数据中心空间和电力。”GPU的生产需要两年的提前期,且数据中‌心还需要获得建‌设许可和支持条件,这些因素共同导致了供应瓶颈。 此外,Ross提到了Meta公司的马克·扎克伯格赞Groq是“唯一一家以完整质量推出产品”的公司。这不仅是对Groq的肯定,也间接指出了其他供应商为了降低成本而采取的各种优化措施,如量化和剪枝,这些问题往往在生产环境中才显露出来。 “今天的人工智能推理市场就像100年前的石油市场,质量参差不齐,”Ross类比道,强调了推理市场的复杂性和不可标准化的特点。Lie则补充说,高性能的推理速度不仅提升了服务质量,还开启了全新的应用领域,比如实时代理工作流。 Patel指出了一个重要的经济问题:尽管行业努力将每百万token的成本降至1.5美元以下,但token的价值远远超过简单的文字处理。“如果这些token真的像我们所说的那样有价值,那不可能只收1美元的费用。”他指出,这些快速成长的初创公司每花费1美元购买tokens,几乎就能产生1美元的收入,这对可持续商业模式构成了挑战。 总的来说,这些对话揭露了AI工厂概念的虚假性和危险性。企业如果继续围绕低质量和标准化交付的价格构建策略,可能会面临失败。成功的关键在于匹配特定的工作负载到合适的基础设施,而不是追求一刀切的解决方案。

Related Links