NVIDIA DGX SparkとStationで実現するデスクトップ上での大規模オープンAIモデル実行
NVIDIAはCES2025で、開発者向けに高性能なデスクトップ型AIスーパーコンピュータ「DGX Spark」と「DGX Station」を発表した。これらのシステムは、オープンソースAIモデルの開発と実用化を加速するための基盤として設計されており、従来はデータセンターにしか導入できなかった大規模モデルを、デスクトップで実行可能にしている。DGX Sparkは1000億パラメータ級のモデルを、DGX Stationは最大1兆パラメータ級のモデルまで処理できる。両機種はNVIDIAのGrace Blackwellアーキテクチャを搭載し、大容量の統合メモリとペタフロップ級のAI性能を実現。特にDGX StationはGB300超チップを採用し、775GBの共通メモリを備え、最先端のAIモデル(例:Meta Llama 4 Maverick、Qwen3、OpenAI gpt-oss-120bなど)をローカルで実行できる。 技術的革新として、NVFP4データフォーマットによりモデルのサイズを最大70%まで圧縮しながら性能を維持。また、llama.cppとの連携により、AIモデルの実行速度が平均35%向上。vLLMやSGLangといった開発コミュニティのメンバーは、DGX Stationのコンパクトな形態により、GB300チップの特徴を低コストでテスト・開発できるようになり、開発サイクルが大幅に短縮されたと評価している。 クリエイター向けには、Black Forest LabsやAlibabaの最新画像・動画生成モデルがNVFP4対応で提供され、MacBook Pro M4 Maxと比較して8倍の高速化が実現。RTX RemixモッドプラットフォームもDGX Sparkと連携し、3DアーティストがAIでアセット生成を高速化できる。AIコーディングアシスタントも導入され、NVIDIA Nsightを活用したローカルでのコード生成が可能に。 業界のリーダーたちも注目。Hugging FaceはDGX Sparkとロボット「Reachy Mini」を連携し、対話型AIエージェントの実現をデモ。IBMはOpenRAGと組み合わせて、データセキュリティとガバナンスを強化したRAGスタックを提供。JetBrainsは、IP保護を重視する企業向けに、DGX Sparkを活用したAI開発環境を提供。また、will.i.amが開発する都市型移動体「TRINITY」もDGX SparkをAIブレインとして搭載し、リアルタイムの視覚言語モデル処理を実現。 DGX SparkはAcer、Dell、HPなど複数メーカーから販売開始。DGX Stationは2026年春からASUS、Dell、Supermicroなどから発売予定。NVIDIA AI Enterpriseソフトウェアのライセンスも1月末に提供開始。これにより、開発者は迅速に実用的なAIプロジェクトを立ち上げられる。
