HyperAIHyperAI

Command Palette

Search for a command to run...

英伟达为何是唯一能免费提供AI模型的科技巨头

Nvidia正成为全球唯一能真正“免费赠送”AI模型的公司。其背后逻辑极为清晰:凭借在AI芯片市场的绝对主导地位,Nvidia能以极低成本获取大规模AI训练集群,而其硬件业务带来的巨额利润,使其完全有能力将AI模型开源,同时以相对低廉的价格销售AI企业级软件套件。其AI Enterprise软件年费仅为每GPU 4500美元,远低于单张Blackwell系列GPU 3.5万至4.5万美元的采购成本。 这让人联想到上世纪IBM System/360时代:购买昂贵主机即附赠免费技术团队支持。如今,Nvidia正重演这一模式,从芯片到软件栈,向全栈整合迈进。未来,它或将成为AI时代的“基础设施服务商”——更准确地说,是“AI公用事业”(AI utility),而非模糊的“云服务”。 Nvidia并非首次涉足开源AI。过去两年半,其在Hugging Face上贡献了650个开源模型和250个数据集,成为2025年最大贡献者。其技术起点是2019年的Megatron-LM,后与微软合作推出5300亿参数的Megatron-Turing NLG。NeMo(Neural Modules)工具包则为后续Nemotron系列打下基础。 Nemotron系列不断演进:Nemotron-4(2024年6月)首次亮相,参数达3400亿;Nemotron 1将Llama 3.1与自研推理技术结合,推出80亿至2350亿参数版本;Nemotron 2 Nano(2024年初)融合Transformer与Mamba架构,提升效率;而最新发布的Nemotron 3则采用混合Mamba-Transformer架构,结合了Transformer的全局建模能力与Mamba对长序列的高效处理。 Nemotron 3的突破在于“潜在专家混合”(latent mixture of experts, MoE)机制。所有专家共享核心计算资源,仅私有部分独立,实现4倍专家数量的调用,同时保持相同推理性能。其Super和Ultra版本分别具备1000亿和5000亿参数,但仅激活100亿和500亿,大幅降低内存占用。该模型还支持高达100万token的上下文窗口,且通过4-bit精度预训练,提升推理效率。 在性能上,Nemotron 3 Nano 30B/3B在推理速度和准确率的平衡上显著优于前代。在AI基准测试中,其输出速度和智能水平均处于领先位置。更关键的是,它在“开放性”与“智能”之间取得良好平衡,为开发者提供高自由度的可定制方案。 若Nvidia未来为Nemotron 3提供技术订阅支持,其成本可控,足以在不依赖高定价的情况下,与OpenAI、Anthropic、Google等闭源模型形成有力竞争。Nvidia的真正优势,不在于模型本身,而在于它能用“硬件+软件+生态”构建一个可持续、可扩展的AI基础设施体系。

相关链接

英伟达为何是唯一能免费提供AI模型的科技巨头 | 热门资讯 | HyperAI超神经