GPT-5.1-Codex-Max: Intelligenter, effizienter, mit langen Arbeitszyklen
GPT-5.1-Codex-Max ist die neueste Generation des agentenbasierten Codiermodells von OpenAI, das ab sofort in Codex verfügbar ist. Im Gegensatz zu allgemeinen Modellen wie GPT-5.1 ist GPT-5.1-Codex-Max speziell für komplexe, langfristige Softwareentwicklungsaufgaben optimiert. Es basiert auf einer überarbeiteten Grundlage, die auf agentenbasierten Aufgaben in Softwareentwicklung, Mathematik und Forschung trainiert wurde. Ein zentrales Neuland ist die native Unterstützung für mehrere Kontextfenster durch eine Technik namens Compaction, die es dem Modell ermöglicht, über Millionen von Tokens hinweg kohärent zu arbeiten – etwa bei umfangreichen Refaktorisierungen, tiefgehenden Debugging-Sitzungen oder Agenten-Loops über mehrere Stunden. Dabei schneidet das Modell deutlich besser ab als seine Vorgänger: Auf dem SWE-Bench Verified-Benchmark erreicht es mit mittlerem Denk-Aufwand 77,9 % gegenüber 73,7 % bei GPT-5.1-Codex, und verbraucht dabei 30 % weniger Denk-Token. Für anspruchsvolle, nicht-latenzsensitive Aufgaben wird zudem ein neuer Extra High-Modus eingeführt, der noch längere Denkprozesse erlaubt. Die verbesserte Token-Effizienz spiegelt sich in realen Anwendungsszenarien wider: GPT-5.1-Codex-Max erzeugt qualitativ hochwertige Frontend-Entwürfe mit vergleichbarer Funktionalität und Ästhetik, aber deutlich geringeren Kosten. Die automatische Compaction sorgt dafür, dass der Modell-Verlauf effizient komprimiert wird, ohne kritische Kontextinformationen zu verlieren, wodurch Aufgaben möglich werden, die zuvor aufgrund von Kontextfenster-Grenzen scheiterten. Intern wurden bereits Aufgaben über 24 Stunden hinweg erfolgreich abgeschlossen, wobei das Modell selbstständig iteriert, Tests korrigiert und schließlich erfolgreich abschließt. In Sicherheitsbewertungen zeigt das Modell zwar noch keine High-Kompetenz im Bereich Cybersecurity gemäß dem Preparedness Framework, ist aber das leistungsfähigste Cybersecurity-Modell, das bisher bereitgestellt wurde. OpenAI arbeitet aktiv an verbesserten Sicherheitsmaßnahmen, einschließlich zusätzlicher Überwachung und Risikominderung, und unterstützt defensive Tools wie das Aardvark-Programm. Codex läuft standardmäßig in einem sicheren Sandbox-Umfeld mit eingeschränktem Dateizugriff und deaktiviertem Netzwerkzugriff – Empfehlung ist, diese Sicherheitsfunktionen aktiv zu halten. Auch wenn das Modell Code-Reviews unterstützt, sollte es als zusätzlicher Prüfer, nicht als Ersatz für menschliche Überprüfungen, betrachtet werden. GPT-5.1-Codex-Max ist ab sofort in allen Codex-Oberflächen (CLI, IDE, Cloud, Code Review) verfügbar und wird zur Standardversion in allen Planen (Plus, Pro, Business, Edu, Enterprise). API-Zugang folgt bald. Die Produktivitätssteigerung ist bereits messbar: Intern nutzen 95 % der OpenAI-Ingenieure Codex wöchentlich und senden rund 70 % mehr Pull Requests seit der Einführung. Mit GPT-5.1-Codex-Max erreichen Agenten neue Dimensionen in der Automatisierung komplexer Entwicklungsprozesse – ein klarer Schritt hin zu zuverlässigen, selbstständigen Software-Partner. Bewertung: Branchenexperten sehen in GPT-5.1-Codex-Max einen Meilenstein für agente-basierte Softwareentwicklung. Die Kombination aus langfristiger Kohärenz, Token-Effizienz und sicherheitsbewusster Architektur macht es zu einem der leistungsfähigsten Tools für moderne DevOps. Die Einführung von Compaction könnte die Grenzen von AI-gestützter Programmierung neu definieren. OpenAIs Ansatz, Sicherheit und Innovation zu balancieren, wird als verantwortungsvoll und zukunftsorientiert bewertet. Für Unternehmen bedeutet dies nicht nur höhere Produktivität, sondern auch eine neue Ära der kooperativen Softwareentwicklung – mit klaren Grenzen, aber ungeahnten Möglichkeiten.
