HyperAIHyperAI

Command Palette

Search for a command to run...

CerebrasとOpenAIが共同開発した超高速コード生成モデル「Codex-Spark」をリリースへ—リアルタイム開発を可能にする新アーキテクチャ搭載

CerebrasとOpenAIは、共同開発した高速推論モデル「GPT-5.3-Codex-Spark」の研究プレビュー版を本日リリースした。これは両社の初の協働成果であり、リアルタイムソフトウェア開発に特化したモデルとして設計されている。Cerebrasのウェーパスケールエンジン(WSE)を搭載し、1秒間に1,000トークン以上の処理速度を実現。開発者がコードを入力する瞬間から即座にフィードバックを提供するため、ライブコーディング環境での応答性を大幅に向上させる。 従来のAIエージェントによる自動開発は、長時間の待機や開発者の関与不足を招くことがあった。これに対し、Codex-Sparkは高速性と操作性を両立。開発者がコードの方向性や設計意図をリアルタイムで調整できる「ドライバーとしての開発者」の立場を強化する。Agenticコーディングの現場では、迅速な修正、計画の見直し、コードベースに関する文脈理解が求められるが、Codex-SparkはこれらのタスクをGPT-5.1-Codex-miniと比較してより高い精度で、かつ大幅に短時間で処理できる。 SWE-Bench ProやTerminal-Bench 2.0といったベンチマークで、小規模モデルながら高い実行能力を発揮。UIのレイアウト変更やスタイル調整、インターフェースの試作など、開発の反復プロセスを効率化する。OpenAIの計算責任者であるSachin Katti氏は、「Cerebrasのウェーパスケールコンピューティングは、低遅延な推論を実現する新たなプラットフォーム能力をもたらした。開発者のフィードバックを通じて、計算資源をシームレスに統合するワークフローの構築を目指す」と語った。 Codex-Sparkは、ChatGPT Proユーザー向けにCodexアプリ、CLI、VS Code拡張機能を通じて提供。APIアクセスは一部の開発パートナーに限定して展開。CerebrasのWSEは、AIプロセッサとして最大級のオンチップメモリを備え、数千トークン/秒/ユーザーの高速推論を可能に。数千台のシステムをスケールアウトすることで、テラバイト単位のメモリ容量を実現し、2026年までにトランジリオンパラメータモデルのトレーニングと推論にも対応する予定。この高速推論技術は、今後のAI開発の基盤となる。

関連リンク

Cerebras SystemsCerebras Systems
CerebrasとOpenAIが共同開発した超高速コード生成モデル「Codex-Spark」をリリースへ—リアルタイム開発を可能にする新アーキテクチャ搭載 | 人気の記事 | HyperAI超神経