英伟达重磅推出开源模型家族Nemotron 3,加速AI生态发展
NVIDIA今日正式发布NVIDIA Nemotron™ 3系列开源模型、数据集与开发工具,旨在推动透明、高效且可定制的智能体AI(agentic AI)在各行业的规模化发展。该系列包含Nano、Super和Ultra三种尺寸,采用创新的混合潜空间专家模型(hybrid latent Mixture-of-Experts, MoE)架构,显著提升多智能体系统在复杂任务中的性能与效率。 随着AI从单模型聊天机器人向协作式多智能体系统演进,开发者面临通信开销大、上下文漂移和推理成本高等挑战。Nemotron 3通过其高效架构,实现高达4倍的token吞吐量,推理生成token减少最多60%,大幅降低部署成本。其100万token的上下文窗口支持长流程、多步骤任务,提升任务连贯性与准确性。独立评测机构Artificial Analysis称Nemotron 3 Nano在同规模模型中兼具最高开放性与效率。 Nemotron 3 Nano已可立即在Hugging Face及Baseten、DeepInfra、Fireworks等多家推理服务提供商平台使用,未来还将上线AWS Amazon Bedrock、Google Cloud、Microsoft Foundry等公有云平台。该模型支持NVIDIA NIM微服务,便于在NVIDIA加速基础设施上安全、可扩展地部署。 Nemotron 3 Super专为低延迟、多智能体协同任务优化,适用于复杂工作流;Nemotron 3 Ultra则作为高级推理引擎,支持深度研究与战略规划。两者均基于NVIDIA Blackwell架构,采用4-bit NVFP4训练格式,显著降低内存占用,提升训练效率。 NVIDIA同步开源了三万亿token的预训练、后训练与强化学习数据集,涵盖推理、编程与多步骤任务,助力构建领域专用智能体。配套发布NeMo Gym、NeMo RL和NeMo Evaluator等开源库,支持训练环境搭建、性能评估与安全验证。所有资源已开放于GitHub和Hugging Face。 目前,Accenture、ServiceNow、Perplexity、Palantir、Oracle、Siemens、Zoom等企业已开始集成Nemotron 3,应用于制造、安全、软件开发、媒体等领域。ServiceNow CEO Bill McDermott表示,Nemotron 3将加速企业级智能工作流自动化。Perplexity CEO Aravind Srinivas指出,其智能体路由系统可灵活调度Nemotron 3与领先闭源模型,实现效率与能力的最优平衡。 Nemotron 3系列还支持LM Studio、llama.cpp、SGLang、vLLM等主流工具,Prime Intellect与Unsloth等公司正将NeMo Gym集成至其工作流,提升开发效率。Nemotron 3 Super与Ultra预计将于2026年上半年发布。
