OpenAI und Broadcom präsentieren LLM-Inferenzchip
OpenAI und Broadcom haben heute ihren ersten eigenentwickelten intelligenten Prozessor „Jalapeño“ gemeinsam vorgestellt. Bei diesem KI-Beschleunigerchip handelt es sich um eine von Grund auf für die Inferenzszenarien großer Sprachmodelle (Large Language Models, LLM) konzipierte Lösung sowie den ersten Baustein der mehrjährigen Rechenplattformstrategie beider Unternehmen. OpenAI-CEO Sam Altman und Präsident Greg Brockman übergab Broadcom-CEO Hock Tan Engineering-Muster des Chips. Der Chip hat im Labor ML-Arbeitslasten einschließlich GPT-5.3-Codex-Spark unter Produktionsziel-Frequenzen und -Leistungsverbrauch erfolgreich ausgeführt. Von der Entwicklung bis zum Wafer-Shot vergingen nur neun Monate. OpenAI bezeichnet dies als den schnellsten ASIC-Entwicklungszyklus in der Branche der hochleistungsfähigen fortschrittlichen Halbleiter. Hinter dieser Beschleunigung steht nicht nur das Design- und Fertigungsknow-how von Broadcom, sondern auch ein vom eigenen Modell optimierter Chipdesign-Prozess – dasselbe Modell bedient sowohl Nutzer als auch trägt zur Verbesserung der Hardware für nachfolgende Generationen bei. Frühe Tests zeigen, dass Jalapeño pro Watt deutlich bessere Leistungen erzielt als aktuelle State-of-the-Lösungen. Die Architektur zielt darauf ab, Datenbewegungen zu minimieren und Ressourcen aus Berechnung, Speicher und Netzwerk auszubalancieren, sodass die tatsächliche Auslastung näher an theoretischen Spitzenwerten liegt. Ein detaillierter technischer Leistungsbericht wird in einigen Monaten veröffentlicht werden. Bei Jalapeño handelt es sich nicht um eine verbesserte Variante eines universellen Beschleunigers, sondern um einen von Grund auf für die LLM-Inferenz entwickelten Chip, basierend auf systemischen Erkenntnissen, die OpenAI durch ChatGPT, Codex, API-Dienste und zukünftige Agent-Produkte gewonnen hat. Das Ziel ist es, zwischen der Durchsatzkapazität führender KI-Beschleuniger und der niedrigen Latenz schneller Inferenzsysteme ein Gleichgewicht zu finden, was ihn für großskalige interaktive LLM-Anwendungen geeignet macht. Der Einsatzpfad wurde ebenfalls klar definiert: Ab Ende 2026 sollen zusammen mit Partnern wie Microsoft Gigawatt-große Rechenzentren aufgebaut und schrittweise erweitert werden. Die Serienproduktion der Plattform wird durch Tomahawk-Netzwerkchips von Broadcom sowie die Leiterplatten- und Systemintegrationsfähigkeiten von Celestica unterstützt. Laut Brockman bewegt sich die Welt hin zu einer durch Rechenleistung getriebenen Wirtschaft. Jalapeño sei Teil ihrer langfristigen Full-Stack-Infrastrukturstrategie – indem weitere eigene Schichten entwickelt würden, könne Intelligence effizienter bereitgestellt und KI einem breiteren Publikum zugänglich gemacht werden.
