HyperAI

NVIDIA今日正式发布NVIDIA Nemotron™ 3系列开源模型、数据集与开发工具，旨在推动透明、高效且可定制的智能体AI（agentic AI）在各行业的规模化发展。该系列包含Nano、Super和Ultra三种尺寸，采用创新的混合潜空间专家模型（hybrid latent Mixture-of-Experts, MoE）架构，显著提升多智能体系统在复杂任务中的性能与效率。随着AI从单模型聊天机器人向协作式多智能体系统演进，开发者面临通信开销大、上下文漂移和推理成本高等挑战。Nemotron 3通过其高效架构，实现高达4倍的token吞吐量，推理生成token减少最多60%，大幅降低部署成本。其100万token的上下文窗口支持长流程、多步骤任务，提升任务连贯性与准确性。独立评测机构Artificial Analysis称Nemotron 3 Nano在同规模模型中兼具最高开放性与效率。 Nemotron 3 Nano已可立即在Hugging Face及Baseten、DeepInfra、Fireworks等多家推理服务提供商平台使用，未来还将上线AWS Amazon Bedrock、Google Cloud、Microsoft Foundry等公有云平台。该模型支持NVIDIA NIM微服务，便于在NVIDIA加速基础设施上安全、可扩展地部署。 Nemotron 3 Super专为低延迟、多智能体协同任务优化，适用于复杂工作流；Nemotron 3 Ultra则作为高级推理引擎，支持深度研究与战略规划。两者均基于NVIDIA Blackwell架构，采用4-bit NVFP4训练格式，显著降低内存占用，提升训练效率。 NVIDIA同步开源了三万亿token的预训练、后训练与强化学习数据集，涵盖推理、编程与多步骤任务，助力构建领域专用智能体。配套发布NeMo Gym、NeMo RL和NeMo Evaluator等开源库，支持训练环境搭建、性能评估与安全验证。所有资源已开放于GitHub和Hugging Face。目前，Accenture、ServiceNow、Perplexity、Palantir、Oracle、Siemens、Zoom等企业已开始集成Nemotron 3，应用于制造、安全、软件开发、媒体等领域。ServiceNow CEO Bill McDermott表示，Nemotron 3将加速企业级智能工作流自动化。Perplexity CEO Aravind Srinivas指出，其智能体路由系统可灵活调度Nemotron 3与领先闭源模型，实现效率与能力的最优平衡。 Nemotron 3系列还支持LM Studio、llama.cpp、SGLang、vLLM等主流工具，Prime Intellect与Unsloth等公司正将NeMo Gym集成至其工作流，提升开发效率。Nemotron 3 Super与Ultra预计将于2026年上半年发布。

相关链接

相关链接

相关链接

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

Command Palette

英伟达重磅推出开源模型家族Nemotron 3，加速AI生态发展

相关链接

Command Palette

英伟达重磅推出开源模型家族Nemotron 3，加速AI生态发展

相关链接

Command Palette

英伟达重磅推出开源模型家族Nemotron 3，加速AI生态发展

相关链接

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新