HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA DGX Spark 与 DGX Station 引领桌面端AI新纪元:强劲算力赋能开源与前沿模型

NVIDIA在CES展会上推出DGX Spark与DGX Station两款桌面级AI超级计算机,助力开发者在本地运行前沿开源AI模型。DGX Spark可支持百亿参数模型,DGX Station则能运行高达万亿参数的大型模型,均基于NVIDIA Grace Blackwell架构,配备大容量统一内存与每秒千万亿次级AI算力,实现从本地开发到云端扩展的无缝衔接。 得益于NVFP4数据格式,AI模型可压缩达70%,性能显著提升且不损失智能。NVIDIA与开源社区合作优化模型效率,例如与llama.cpp协作,使DGX Spark运行主流大模型平均性能提升35%。DGX Station搭载GB300 Grace Blackwell Ultra超芯片,拥有775GB统一内存与FP4精度,支持运行Kimi-K2、DeepSeek-V3.2、Mistral Large 3、Meta Llama 4 Maverick、Qwen3及OpenAI gpt-oss-120b等先进模型。 开发者反馈称,DGX Station将数据中心级算力带入桌面,极大缩短开发迭代周期。vLLM核心维护者Kaichao You表示,该系统使团队能低成本测试GB300专属功能;SGLang社区贡献者Jerry Zhou则称,其可本地运行Qwen3-235B等超大模型,支持CUDA内核开发,无需依赖云资源。 在创意领域,DGX Spark可加速视频生成任务,相比M4 Max MacBook Pro实现8倍性能提升,支持Black Forest Labs FLUX.2、FLUX.1及阿里Qwen-Image等模型的NVFP4优化。Lightricks新发布的LTX-2视频模型也提供NVIDIA GPU专用量化版本。RTX Remix模组平台将借助DGX Spark实现3D资产生成加速,提升游戏模组开发效率。 AI编程助手方面,NVIDIA在DGX Spark上推出本地CUDA编程辅助工具,保障代码安全的同时提升开发效率。行业领袖纷纷认可本地AI趋势:Hugging Face表示DGX Spark让AI代理“有形有声”,可与真实机器人Reachy Mini联动;IBM推出基于DGX Spark的OpenRAG完整本地RAG方案;JetBrains则强调其为开发者提供对数据与知识产权的完全控制。 未来城市交通新范式TRINITY智能三轮车也亮相CES,以DGX Spark为AI核心,实现实时视觉语言模型推理,支持对话式交互与目标追踪,体现“AI上车”的新可能。 NVIDIA同步发布六项新开发指南与四项更新,覆盖Nemotron 3 Nano、机器人训练、多模态模型微调、基因组学与金融分析等场景。NVIDIA AI Enterprise软件支持已面向DGX Spark及GB10系统开放,预计1月底起提供授权。 目前,DGX Spark由Acer、Amazon、ASUS、Dell、GIGABYTE、HP、Lenovo、Micro Center、MSI、PNY等厂商发售;DGX Station将于2026年春季由ASUS、Boxx、Dell、GIGABYTE、HP、MSI、Supermicro推出。

相关链接