HyperAI

Nvidia正成为全球唯一能真正“免费赠送”AI模型的公司。其背后逻辑极为清晰：凭借在AI芯片市场的绝对主导地位，Nvidia能以极低成本获取大规模AI训练集群，而其硬件业务带来的巨额利润，使其完全有能力将AI模型开源，同时以相对低廉的价格销售AI企业级软件套件。其AI Enterprise软件年费仅为每GPU 4500美元，远低于单张Blackwell系列GPU 3.5万至4.5万美元的采购成本。这让人联想到上世纪IBM System/360时代：购买昂贵主机即附赠免费技术团队支持。如今，Nvidia正重演这一模式，从芯片到软件栈，向全栈整合迈进。未来，它或将成为AI时代的“基础设施服务商”——更准确地说，是“AI公用事业”（AI utility），而非模糊的“云服务”。 Nvidia并非首次涉足开源AI。过去两年半，其在Hugging Face上贡献了650个开源模型和250个数据集，成为2025年最大贡献者。其技术起点是2019年的Megatron-LM，后与微软合作推出5300亿参数的Megatron-Turing NLG。NeMo（Neural Modules）工具包则为后续Nemotron系列打下基础。 Nemotron系列不断演进：Nemotron-4（2024年6月）首次亮相，参数达3400亿；Nemotron 1将Llama 3.1与自研推理技术结合，推出80亿至2350亿参数版本；Nemotron 2 Nano（2024年初）融合Transformer与Mamba架构，提升效率；而最新发布的Nemotron 3则采用混合Mamba-Transformer架构，结合了Transformer的全局建模能力与Mamba对长序列的高效处理。 Nemotron 3的突破在于“潜在专家混合”（latent mixture of experts, MoE）机制。所有专家共享核心计算资源，仅私有部分独立，实现4倍专家数量的调用，同时保持相同推理性能。其Super和Ultra版本分别具备1000亿和5000亿参数，但仅激活100亿和500亿，大幅降低内存占用。该模型还支持高达100万token的上下文窗口，且通过4-bit精度预训练，提升推理效率。在性能上，Nemotron 3 Nano 30B/3B在推理速度和准确率的平衡上显著优于前代。在AI基准测试中，其输出速度和智能水平均处于领先位置。更关键的是，它在“开放性”与“智能”之间取得良好平衡，为开发者提供高自由度的可定制方案。若Nvidia未来为Nemotron 3提供技术订阅支持，其成本可控，足以在不依赖高定价的情况下，与OpenAI、Anthropic、Google等闭源模型形成有力竞争。Nvidia的真正优势，不在于模型本身，而在于它能用“硬件+软件+生态”构建一个可持续、可扩展的AI基础设施体系。

相关链接

相关链接

相关链接

MIT 开发 Pichia-CLM 模型学习酵母 DNA「语言」，外源蛋白产量最高可提高至 3 倍

MIT 开发 Pichia-CLM 模型学习酵母 DNA「语言」，外源蛋白产量最高可提高至 3 倍

Command Palette

英伟达为何是唯一能免费提供AI模型的科技巨头

相关链接

Command Palette

英伟达为何是唯一能免费提供AI模型的科技巨头

相关链接

Command Palette

英伟达为何是唯一能免费提供AI模型的科技巨头

相关链接

MIT 开发 Pichia-CLM 模型学习酵母 DNA「语言」，外源蛋白产量最高可提高至 3 倍

MIT 开发 Pichia-CLM 模型学习酵母 DNA「语言」，外源蛋白产量最高可提高至 3 倍