HyperAI超神经

NVIDIA在CES展会上推出DGX Spark与DGX Station两款桌面级AI超级计算机，助力开发者在本地运行前沿开源AI模型。DGX Spark可支持百亿参数模型，DGX Station则能运行高达万亿参数的大型模型，均基于NVIDIA Grace Blackwell架构，配备大容量统一内存与每秒千万亿次级AI算力，实现从本地开发到云端扩展的无缝衔接。得益于NVFP4数据格式，AI模型可压缩达70%，性能显著提升且不损失智能。NVIDIA与开源社区合作优化模型效率，例如与llama.cpp协作，使DGX Spark运行主流大模型平均性能提升35%。DGX Station搭载GB300 Grace Blackwell Ultra超芯片，拥有775GB统一内存与FP4精度，支持运行Kimi-K2、DeepSeek-V3.2、Mistral Large 3、Meta Llama 4 Maverick、Qwen3及OpenAI gpt-oss-120b等先进模型。开发者反馈称，DGX Station将数据中心级算力带入桌面，极大缩短开发迭代周期。vLLM核心维护者Kaichao You表示，该系统使团队能低成本测试GB300专属功能；SGLang社区贡献者Jerry Zhou则称，其可本地运行Qwen3-235B等超大模型，支持CUDA内核开发，无需依赖云资源。在创意领域，DGX Spark可加速视频生成任务，相比M4 Max MacBook Pro实现8倍性能提升，支持Black Forest Labs FLUX.2、FLUX.1及阿里Qwen-Image等模型的NVFP4优化。Lightricks新发布的LTX-2视频模型也提供NVIDIA GPU专用量化版本。RTX Remix模组平台将借助DGX Spark实现3D资产生成加速，提升游戏模组开发效率。 AI编程助手方面，NVIDIA在DGX Spark上推出本地CUDA编程辅助工具，保障代码安全的同时提升开发效率。行业领袖纷纷认可本地AI趋势：Hugging Face表示DGX Spark让AI代理“有形有声”，可与真实机器人Reachy Mini联动；IBM推出基于DGX Spark的OpenRAG完整本地RAG方案；JetBrains则强调其为开发者提供对数据与知识产权的完全控制。未来城市交通新范式TRINITY智能三轮车也亮相CES，以DGX Spark为AI核心，实现实时视觉语言模型推理，支持对话式交互与目标追踪，体现“AI上车”的新可能。 NVIDIA同步发布六项新开发指南与四项更新，覆盖Nemotron 3 Nano、机器人训练、多模态模型微调、基因组学与金融分析等场景。NVIDIA AI Enterprise软件支持已面向DGX Spark及GB10系统开放，预计1月底起提供授权。目前，DGX Spark由Acer、Amazon、ASUS、Dell、GIGABYTE、HP、Lenovo、Micro Center、MSI、PNY等厂商发售；DGX Station将于2026年春季由ASUS、Boxx、Dell、GIGABYTE、HP、MSI、Supermicro推出。

相关链接

相关链接

相关链接

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑

Command Palette

NVIDIA DGX Spark 与 DGX Station 引领桌面端AI新纪元：强劲算力赋能开源与前沿模型

相关链接

Command Palette

NVIDIA DGX Spark 与 DGX Station 引领桌面端AI新纪元：强劲算力赋能开源与前沿模型

相关链接

Command Palette

NVIDIA DGX Spark 与 DGX Station 引领桌面端AI新纪元：强劲算力赋能开源与前沿模型

相关链接

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑