HyperAIHyperAI

Command Palette

Search for a command to run...

4日前
OpenAI
LLM

OpenAIとBroadcom、LLM最適化推論チップ発表

OpenAIとブロードコムは本日、自社開発の初となるインテリジェントプロセッサ「Jalapeno」を共同で発表した。これは大規模言語モデル(LLM)推論向けにゼロから設計されたAIアクセラレーションチップであり、両社の複数世代にわたるコンピューティングプラットフォーム戦略における最初の基盤である。 OpenAI最高経営責任者(CEO)サム・アルトマン氏およびプレジデントのグレッグ・ブロックマン氏は、ブロードコムのヘック・タンCEOよりエンジニアリングサンプルを受け取った。このチップは実験室環境において、生産目標周波数と消費電力下での機械学習ワークロードの実行に成功しており、その対象にはGPT-5.3-Codex-Sparkが含まれる。 デザインからマスク書き起こしまでわずか9ヶ月で完了し、OpenAIはこの期間が「ハイパフォーマンス先進半導体分野における最速のASIC開発サイクル」と称している。こうした高速化を支えた背景として、OpenAIは単なるブロードコムの設計製造力への依存にとどまらず、同社自身のモデルを用いてチップ設計プロセスの最適化にも参加したという点がある。すなわち、同じモデルがユーザーに対してサービスを提供すると同時に、次世代ハードウェアの改善にも寄与しているのである。 初期テストの結果、Jalapenoのワットあたりの性能は現在の最先端ソリューションを大幅に上回っていることが示されている。そのアーキテクチャはデータ転送量の削減に重点を置き、計算、メモリ、ネットワーク資源をバランスよく配分することで、実際の利用効率を理論上のピーク値に近いものとしている。詳細なパフォーマンス技術レポートは今後数ヶ月以内に公開される予定だ。 Jalapenoは汎用アクセラレータの改良版ではなく、ChatGPTやCodex、API、そして将来のエージェント製品などで得られたシステムレベルの知見に基づき、LLM推論のためにゼロから設計されたものである。その目的は、トップクラスのAIアクセラレータが持つスループットの能力と、最も迅速な推論システムの低いレイテンシとの間で最適なバランスを見つけ出し、大規模な対話型LLM製品の運用に適応させることにある。 導入計画も明確になっている。2026年末以降、マイクロソフトなどのパートナーと共にギガワット級のデータセンター建設を開始し、年を追うごとに拡張していく方針だ。ブロードコムのTomahawkネットワークチップとCelesticaによる基板およびシステム統合能力が、本プラットフォームの大規模量産をサポートする。 ブロックマン氏は次のように述べている。「世界はコンピュートパワー主導の経済へと移行しつつあります。Jalapenoは当社の長期的なフルスタックインフラストラクチャー戦略の一部であり、さらに多くの自律的な層を独自に設計することで、より高い効率性のもとでより多くのインテリジェンスを提供し、AIをより多くの人々に身近なものにしていきます。」

関連リンク