OpenAI stellt ersten selbstentwickelten KI-Chip vor
Am 24. Juni hat OpenAI seinen ersten eigenentwickelten KI-Chip vorgestellt, der unter dem internen Codenamen Jalapeño firmiert. Das Entwicklungskooperation vereint OpenAI, Broadcom und den Auftragsfertiger TSMC und basiert auf einer fortschrittlichen 3-Nanometer-Architektur. Innerhalb von neun Monaten wurde das Design von der ersten Architekturphase bis zum Fertigungsstart durchlaufen, ein Tempo, das im Bereich hochleistungsfähiger maßgeschneiderter Halbleiter als historischer Rekord gilt. Abweichend von der branchenüblichen Kategorisierung als KI-Beschleuniger klassifiziert OpenAI das Bauteil als Intelligence Processor. Es handelt sich um eine speziell auf KI-Inferenzprozesse optimierte Anwendungsspezifische Schaltkreis-Technologie mit systolischem Array und High-Bandwidth-Speicher. Zentrales Entwicklungskonzept ist der Einsatz der eigenen Sprachmodelle zur Automatisierung und Beschleunigung des Chipdesigns sowie zur Minimierung von Datenbewegungen. Dadurch soll die tatsächliche Rechenauslastung der theoretischen Kapazität erheblich angenähert werden. Die technische Leitung obliegt Richard Ho, der zuvor jahrelang am TPU-Projekt von Google mitwirkte. Laut Aussagen von Broadcom-Chef Hock Tan entspricht die Leistungsfähigkeit des Chips bereits aktuellen Serien von Nvidia und Google. Parallel sollen die Inferenzkosten im Vergleich zu konventionellen KI-Prozessoren um circa fünfzig Prozent sinken, wovon OpenAI offiziell noch abwartet. Die strategische Motivation hinter dem Projekt liegt in der Diversifizierung der Hardwarebasis und der Verringerung der marktweiten Abhängigkeit von externen GPU-Lieferanten. Der Aufbau einer vollständig integrierten Infrastrukturkette von der Architektur über den Speicher bis zur Netzwerkverteilung soll die Kostenkontrolle und Effizienz steigern. Erste Prototyp-Einsätze in Laboren verliefen erfolgreich, wobei bereits komplexe Modellworkloads stabil liefen. Für die kommerzielle Rollout-Phase peilt OpenAI erste Pilotdeployments bis Ende 2026 an, gefolgt von einer Hochskalierung auf 1,3 Gigawatt Leistung im Jahr 2027 und einer Vollauslastung bis 2028. Die Hardware wird ausschließlich intern in Partnerrechenzentren eingesetzt; ein Verkauf ist nicht vorgesehen. Die physische Serverintegration wird von Celestica übernommen. Auf dem bereits umkämpften KI-Hardwaremarkt positioniert sich OpenAI mit Jalapeño als schnell adaptierender Akteur neben etablierten Lösungen wie Googles TPU, Amazons Trainium sowie den Entwicklungen von Microsoft und Meta. Trotz des raschen Fortschritts bleiben strukturelle Herausforderungen bestehen. Die Entwicklung und Validierung von ASICs erfordert signifikante Investitionen in Forschung und Personal. Zudem weist die auf Inferenz spezialisierte Architektur im Vergleich zu universellen GPUs eine geringere Flexibilität bei rasanten Änderungen der Modellarchitekturen auf. Die langfristige Marktfähigkeit hängt maßgeblich davon ab, ob das derzeit etwa vierzig Personen starke Hardwareteam die nötige iterative Weiterentwicklung und Skalierbarkeit gewährleisten kann.
