Cerebras und OpenAI starten mit schnellem Codex-Spark im Forschungs-Preview
Cerebras und OpenAI kündigen heute die Einführung des neuen GPT-5.3-Codex-Spark-Modells an, das erstmals in einer Forschungsvorabversion verfügbar ist. Dies markiert den Beginn einer strategischen Zusammenarbeit zwischen beiden Unternehmen. Das Modell basiert auf der Cerebras-Wafer-Scale-Engine und ist speziell für Echtzeit-Softwareentwicklung optimiert, bei der niedrige Latenz ebenso wichtig ist wie hohe Intelligenz. Mit einer Geschwindigkeit von über 1.000 Tokens pro Sekunde ermöglicht es nahezu sofortige Rückmeldungen in interaktiven Codierumgebungen. Im Gegensatz zu traditionellen, langsameren Modellen, die bei agenter Softwareentwicklung oft zu längeren Wartezeiten führen, bleibt der Entwickler mit Codex-Spark aktiv im Prozess – er kann gezielt steuern, korrigieren und den Arbeitsablauf kontinuierlich anpassen. Dies ist entscheidend, da Softwareentwicklung iterativ ist und menschliches Urteil, Geschmack und Kontextverständnis benötigt. Codex-Spark ist ein leistungsfähiges, aber kleines Modell, das für schnelle Inferenz optimiert ist. Auf Benchmark-Tests wie SWE-Bench Pro und Terminal-Bench 2.0 übertrifft es sogar GPT-5.1-Codex-mini in der Aufgabenerfüllung, jedoch deutlich schneller. Es zeigt besondere Stärken bei präzisen Codeänderungen, der Überarbeitung von Entwicklungsplänen und kontextbezogenen Fragen zu bestehendem Code. Entwickler können damit schnell Prototypen visualisieren, Designs anpassen oder Interface-Änderungen testen – alles in Echtzeit. Sachin Katti, Head of Compute bei OpenAI, betont die Bedeutung der technischen Partnerschaft mit Cerebras: „Cerebras war ein hervorragender technischer Partner, und wir freuen uns, schnelle Inferenz als neue Plattformfunktion einzuführen. Die Nutzung wafer-skalaren Rechenleistung in der Produktion eröffnet uns neue Möglichkeiten, Codex auch bei latency-kritischen Aufgaben reaktionsfähig zu halten.“ Die Cerebras-Wafer-Scale-Engine verfügt über den größten On-Chip-Speicher aller AI-Chips und ermöglicht Geschwindigkeiten von Tausenden Tokens pro Sekunde pro Nutzer. Die Architektur skaliert auf Tausende Systeme aus, wodurch Speicherkapazitäten im Multi-Terabyte-Bereich erreicht werden – eine Voraussetzung für die Verarbeitung von Trillionen-Parameter-Modellen sowohl beim Training als auch bei der Inferenz. Cerebras plant, diese Leistung auch für die größten Frontier-Modelle bis 2026 nutzbar zu machen. Codex-Spark ist ab heute als Forschungsvorabversion für ChatGPT Pro-Nutzer über die Codex-App, CLI und VS Code-Erweiterung verfügbar. API-Zugang wird zunächst ausgewählten Design-Partnern bereitgestellt. In der Branche wird die Kombination aus Cerebras’ Hardware und OpenAIs Modellentwicklung als bahnbrechend angesehen. Experten sehen darin einen Meilenstein für die Zukunft der agenten Softwareentwicklung – nicht nur wegen der Geschwindigkeit, sondern auch wegen der Möglichkeit, menschliche Kontrolle und Kreativität in den Zentrum des Prozesses zu stellen. Cerebras, ein führender Anbieter von AI-Hardware, hat sich mit der Wafer-Scale-Engine einen Alleinstellungsmerkmal geschaffen, das besonders für datenintensive, latenzkritische Anwendungen wie Echtzeit-Coding entscheidend ist. Die Kooperation mit OpenAI unterstreicht die wachsende Bedeutung von spezialisierten Hardwareplattformen in der nächsten Generation künstlicher Intelligenz.
