HyperAIHyperAI

Command Palette

Search for a command to run...

OpenAIのCodexに新専用チップ搭載で性能向上

OpenAIは、アジェンティックなコード生成ツール「Codex」の軽量版「GPT-5.3-Codex-Spark」を発表した。この新モデルは、同社が今月初めにリリースした大規模モデル「GPT-5.3-Codex」の軽量化版であり、高速な推論(inference)を実現することを目的としている。Sparkは、リアルタイムでの共同作業や迅速なプロトタイピングに最適化されており、従来のモデルが担う長時間の複雑なタスクとは異なり、即時応答を重視する使い方を想定している。現在、ChatGPT Proユーザーを対象にCodexアプリ内で研究用プレビューが提供されている。 この実現の鍵を握るのが、ハードウェアパートナーであるCerebras社の最新チップ「Wafer Scale Engine 3(WSE-3)」だ。WSE-3は4兆個のトランジスタを搭載するウェーハスケールマクロチップであり、従来のGPUアーキテクチャとは異なり、一枚のチップ上で膨大な計算資源を統合。OpenAIは、このチップを用いて極めて低遅延の推論を実現し、ユーザーの操作に即座に反応するAI体験を可能にした。この統合は、同社が先月発表したCerebrasとの多額の提携(100億ドル超)の最初の成果として位置づけられている。OpenAIは、この提携を「AIの応答速度を飛躍的に向上させる」と説明しており、Sparkをその「最初のマイルストーン」として評価している。 CEOのサム・アルトマン氏は発表前、ツイートで「Codexユーザー向けに特別なものが今日発表される」と示唆し、「それは私にとって喜びをもたらす」と表現。この発言は、Sparkが単なる技術的進化ではなく、ユーザー体験の質を根本から変える可能性を秘めていることを示唆している。 OpenAIは、Sparkの導入を「Codexの二つのモードを統合する第一歩」と位置づけている。一つはリアルタイムでの迅速な反応(Spark)、もう一つは深層的な推論と長時間実行を必要とするタスク(従来モデル)だ。Cerebrasのチップは、極めて低遅延を要するワークロードに特化しており、この分野で優れた性能を発揮することが期待される。 Cerebrasは10年以上にわたり半導体分野に取り組んできたが、AIブームのなかでその重要性が高まり、先週には10億ドルの資金調達を達成し、230億ドルの評価額を記録。同社は今後、IPOの検討も進めている。CerebrasのCTO・共同創業者であるシーアン・リー氏は、「高速推論が可能にすること――新しいインタラクションパターンやユースケース、根本的に異なるモデル体験――にわくわくしている」と語り、開発者コミュニティとの協働による可能性に期待を寄せている。 Sparkの登場は、AIツールの使い方を「即時性」にシフトさせる転換点であり、今後の開発環境に大きな影響を与える可能性を秘めている。

関連リンク

OpenAIのCodexに新専用チップ搭載で性能向上 | 人気の記事 | HyperAI超神経