HyperAI

OpenAI stellt mit GPT-5.3-Codex den leistungsstärksten bisherigen agilen Programmier-Agenten vor, der nicht nur Code schreibt, sondern den gesamten Softwareentwicklungsprozess – von der Planung über Debugging, Deployment bis hin zur Dokumentation – autonom bewältigen kann. Im Gegensatz zu früheren Modellen integriert GPT-5.3-Codex verbesserte Codierleistung, tiefere reasoning-Fähigkeiten und professionelles Wissen in einem einzigen Modell, das gleichzeitig 25 % schneller läuft. Ein entscheidender Meilenstein: Das Modell war maßgeblich an seiner eigenen Entwicklung beteiligt – frühe Versionen halfen beim Debuggen des Trainings, bei der Evaluierung und beim Management der Bereitstellung, was die Entwicklerteams beeindruckte. GPT-5.3-Codex erreicht Spitzenwerte in mehreren Benchmarks: 56,8 % auf SWE-Bench Pro (ein anspruchsvolles, mehrsprachiges Testfeld für echte Software-Engineering-Aufgaben), 77,3 % auf Terminal-Bench 2.0 und 64,7 % auf OSWorld-Verified – allen voran in der Fähigkeit, komplexe Aufgaben in einer visuellen Desktop-Umgebung zu erledigen. Auch in GDPval, dem Benchmark für berufliche Wissensarbeit, zeigt es starke Leistung, die mit GPT-5.2 vergleichbar ist. Besonders bemerkenswert ist, dass es mit weniger Tokens auskommt als seine Vorgänger, was effizientere und kostengünstigere Anwendungen ermöglicht. Die Fähigkeiten des Modells wurden in praktischen Tests unter Beweis gestellt: Es entwickelte autonom zwei Web-Spiele – eine verbesserte Version eines Rennspiels und ein Tauchspiel – über mehrere Tage hinweg, wobei es durch iterative Verbesserungen wie Bugfixes und UX-Optimierungen autonom arbeitete. Bei der Erstellung von Landing Pages verstand es nun bessere Intentionen: So zeigte es statt einer einfachen Multiplikation des Jahrespreises einen klareren, diskontierten Monatspreis und integrierte eine dynamische Testimonial-Carousel mit drei unterschiedlichen Stimmen – ein Produkt, das nahezu produktionsreif wirkt. GPT-5.3-Codex unterstützt nicht nur Softwareentwickler, sondern auch Designer, Produktmanager und Datenwissenschaftler, indem es bei der Erstellung von PRDs, Präsentationen, Tabellen und Analysen hilft. Seine agenteigenen Fähigkeiten reichen über den Code hinaus: Es kann selbstständig Aufgaben planen, Ressourcen skalieren und auf Veränderungen reagieren – etwa durch dynamische GPU-Cluster-Management bei Verkehrspeak. Ein besonderer Fokus liegt auf Cybersecurity: GPT-5.3-Codex ist das erste Modell, das explizit auf die Erkennung von Software-Sicherheitslücken trainiert wurde und als „High Capability“ im Bereich Cybersecurity klassifiziert ist. Obwohl es keine end-to-end-Angriffe automatisieren kann, wird ein umfassender Sicherheitsstack eingesetzt – inklusive Sicherheitstraining, automatischer Überwachung, Trusted Access und Bedrohungsintelligenz. Als Teil der Sicherheitsstrategie startet OpenAI „Trusted Access for Cyber“ und erweitert den privaten Beta-Zugang zu Aardvark, einem Sicherheitsforschungs-Agenten. Zudem werden 10 Millionen API-Credits für die Cyber-Sicherheitsforschung bereitgestellt, insbesondere für Open-Source-Projekte wie Next.js, wo bereits Sicherheitslücken mit Hilfe von Codex identifiziert wurden. GPT-5.3-Codex ist ab sofort in den kostenpflichtigen ChatGPT-Plänen über die App, CLI, IDE-Erweiterung und Web verfügbar. Die API-Zugänge werden in Kürze freigegeben. Die Leistungsfähigkeit wurde durch die Nutzung von NVIDIA GB200 NVL72-Systemen erheblich gesteigert. Mit GPT-5.3-Codex markiert Codex einen Paradigmenwechsel: von einem reinen Code-Generator zu einem allgemeinen, interaktiven Kollegen am Computer, der komplexe, langfristige Aufgaben end-to-end erledigt. Die Zukunft liegt nicht mehr nur in der Automatisierung einzelner Schritte, sondern in der kooperativen Arbeit zwischen Mensch und Agent – wobei die Qualität der Interaktion zunehmend entscheidend wird. Bewertung durch Branchenexperten: Industrielle Analysten sehen in GPT-5.3-Codex einen Meilenstein für die Entwicklung von „autonomen Software-Agenten“. Die Fähigkeit, sich selbst zu optimieren und in der Forschung zu agieren, deutet auf eine neue Ära der selbstverbessernden KI hin. Die Sicherheitsmaßnahmen werden als verantwortungsvoll und vorbildlich bewertet, besonders die Kombination aus proaktiver Forschungsförderung und Schutzmechanismen. Die Integration in bestehende Entwicklungsworkflow ist bereits heute ein Wettbewerbsvorteil für Teams, die schneller und effizienter arbeiten wollen. OpenAI positioniert sich damit als führender Player im Bereich agiler KI-Systeme, die nicht nur den Entwicklungsprozess beschleunigen, sondern die Art und Weise, wie Menschen mit Technologie zusammenarbeiten, grundlegend verändern.

Verwandte Links

Verwandte Links

Verwandte Links

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.

Command Palette

GPT-5.3-Codex: Fortschrittlicher Agent für Code und komplexe Aufgaben

Verwandte Links

Command Palette

GPT-5.3-Codex: Fortschrittlicher Agent für Code und komplexe Aufgaben

Verwandte Links

Command Palette

GPT-5.3-Codex: Fortschrittlicher Agent für Code und komplexe Aufgaben

Verwandte Links

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.