HyperAI

OpenAI正式发布全新模型GPT-5.3-Codex，标志着编码代理能力的重大飞跃。该模型融合了GPT-5.2-Codex的前沿编程性能与GPT-5.2的推理及专业领域知识能力，成为目前最强大的智能代理型编程模型，推理速度提升25%。 GPT-5.3-Codex首次实现了自我驱动开发——其训练与部署过程由早期版本的自身代码完成，包括调试、测试评估和部署管理，团队惊叹于其自我优化能力。该模型不仅能编写和审查代码，更可独立完成从研究、工具调用到复杂执行的全流程任务，如同一位可实时互动、持续汇报进展的同事。在权威基准测试中，GPT-5.3-Codex表现卓越：在SWE-Bench Pro（涵盖四种语言、更具真实性和抗污染性）上达到56.8%准确率，刷新行业纪录；在Terminal-Bench 2.0上以77.3%领先，且用更少的token完成任务，显著提升效率。在OSWorld和GDPval测试中也展现出强大真实世界操作与专业工作能力。为验证其长期任务处理能力，团队要求GPT-5.3-Codex自主开发两款网页游戏——赛车游戏与潜水游戏。模型通过数百万token的迭代，自主修复漏洞、优化体验，最终生成功能完整、可直接运行的成品，展示了从零构建复杂应用的潜力。在日常开发中，GPT-5.3-Codex对用户指令的理解更精准。例如，当被要求创建落地页时，它会自动将年费计划以月费形式展示并标注折扣，同时生成包含三段用户评价的动态轮播，使页面更接近生产级效果。该模型已全面支持软件开发生命周期中的各类任务：调试、部署、监控、撰写PRD、编辑文案、用户研究、编写测试用例与分析数据等。其能力延伸至幻灯片制作、数据处理等专业工作，真正成为跨领域的数字协作者。在安全方面，GPT-5.3-Codex是首个被归类为“高能力”网络安全任务模型的版本，首次经过专门训练识别软件漏洞。尽管尚未证实可实现端到端攻击，但OpenAI已部署最全面的安全防护体系，包括安全训练、实时监控、可信访问控制与威胁情报整合。为支持防御性研究，OpenAI推出“可信访问·网络安全”试点计划，并扩展Aardvark安全研究代理的私有测试范围，与开源社区合作免费扫描如Next.js等关键项目。同时，将新增1000万美元API额度，支持开源与关键基础设施的安全研究。 GPT-5.3-Codex现已上线，可通过付费ChatGPT计划在App、CLI、IDE插件及网页端使用，API接入正在安全评估中。该模型运行于NVIDIA GB200 NVL72系统，依托强大算力实现更快速响应。随着模型能力的跃升，人机协作的效率正从“模型能做什么”转向“如何高效引导与管理多个代理协同工作”。GPT-5.3-Codex不仅是一个编码工具，更正推动人类迈向以智能代理为伙伴的新型生产力时代。

相关链接

相关链接

相关链接

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

Command Palette

重磅发布 GPT-5.3-Codex：代码生成新纪元，开发者迎来智能革命

相关链接

Command Palette

重磅发布 GPT-5.3-Codex：代码生成新纪元，开发者迎来智能革命

相关链接

Command Palette

重磅发布 GPT-5.3-Codex：代码生成新纪元，开发者迎来智能革命

相关链接

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力