HyperAIHyperAI

Command Palette

Search for a command to run...

重磅发布 GPT-5.3-Codex:代码生成新纪元,开发者迎来智能革命

OpenAI正式发布全新模型GPT-5.3-Codex,标志着编码代理能力的重大飞跃。该模型融合了GPT-5.2-Codex的前沿编程性能与GPT-5.2的推理及专业领域知识能力,成为目前最强大的智能代理型编程模型,推理速度提升25%。 GPT-5.3-Codex首次实现了自我驱动开发——其训练与部署过程由早期版本的自身代码完成,包括调试、测试评估和部署管理,团队惊叹于其自我优化能力。该模型不仅能编写和审查代码,更可独立完成从研究、工具调用到复杂执行的全流程任务,如同一位可实时互动、持续汇报进展的同事。 在权威基准测试中,GPT-5.3-Codex表现卓越:在SWE-Bench Pro(涵盖四种语言、更具真实性和抗污染性)上达到56.8%准确率,刷新行业纪录;在Terminal-Bench 2.0上以77.3%领先,且用更少的token完成任务,显著提升效率。在OSWorld和GDPval测试中也展现出强大真实世界操作与专业工作能力。 为验证其长期任务处理能力,团队要求GPT-5.3-Codex自主开发两款网页游戏——赛车游戏与潜水游戏。模型通过数百万token的迭代,自主修复漏洞、优化体验,最终生成功能完整、可直接运行的成品,展示了从零构建复杂应用的潜力。 在日常开发中,GPT-5.3-Codex对用户指令的理解更精准。例如,当被要求创建落地页时,它会自动将年费计划以月费形式展示并标注折扣,同时生成包含三段用户评价的动态轮播,使页面更接近生产级效果。 该模型已全面支持软件开发生命周期中的各类任务:调试、部署、监控、撰写PRD、编辑文案、用户研究、编写测试用例与分析数据等。其能力延伸至幻灯片制作、数据处理等专业工作,真正成为跨领域的数字协作者。 在安全方面,GPT-5.3-Codex是首个被归类为“高能力”网络安全任务模型的版本,首次经过专门训练识别软件漏洞。尽管尚未证实可实现端到端攻击,但OpenAI已部署最全面的安全防护体系,包括安全训练、实时监控、可信访问控制与威胁情报整合。 为支持防御性研究,OpenAI推出“可信访问·网络安全”试点计划,并扩展Aardvark安全研究代理的私有测试范围,与开源社区合作免费扫描如Next.js等关键项目。同时,将新增1000万美元API额度,支持开源与关键基础设施的安全研究。 GPT-5.3-Codex现已上线,可通过付费ChatGPT计划在App、CLI、IDE插件及网页端使用,API接入正在安全评估中。该模型运行于NVIDIA GB200 NVL72系统,依托强大算力实现更快速响应。 随着模型能力的跃升,人机协作的效率正从“模型能做什么”转向“如何高效引导与管理多个代理协同工作”。GPT-5.3-Codex不仅是一个编码工具,更正推动人类迈向以智能代理为伙伴的新型生产力时代。

相关链接