HyperAI超神经

OpenAI 在经历数周预热后，于当地时间8月5日正式发布两款全新的开源推理模型：gpt-oss-120b 和 gpt-oss-20b，分别拥有约1170亿和210亿参数。这两款模型均采用Apache 2.0开源许可协议，可在Hugging Face等平台免费下载，支持商业用途、自由修改与再分发，并以MXFP4原生量化格式提供，显著降低部署门槛。尽管OpenAI此前长期以闭源为主，上一次开放权重还要追溯到2019年的GPT-2，但此次发布标志着其在开源战略上的重大转向。尤其在DeepSeek、Qwen等中国开源模型迅速崛起、引发全球关注的背景下，OpenAI此举被视为对开源生态竞争压力的直接回应。两款模型均采用稀疏专家（MoE）架构：gpt-oss-120b包含128个专家，每token激活4个；gpt-oss-20b则有32个专家。两者上下文窗口均为128k，支持思维链（Chain-of-Thought）、结构化输出和工具调用，可无缝集成OpenAI的Responses API，适用于构建复杂代理系统。性能方面，gpt-oss-120b在多项推理任务（如AIME、GPQA、MMLU）中表现接近甚至超越OpenAI专有模型o4-mini，且在SWE-bench、Codeforces等代码与工具调用任务中展现出强大能力，甚至在HealthBench测试中超越GPT-4o和o1。gpt-oss-20b虽参数较小，但仅需16GB显存即可在笔记本电脑上本地运行，适合快速开发与迭代。值得注意的是，两款模型的思维链为无监督设计，OpenAI强调此举有助于研究人员自主构建推理监控机制，以识别潜在的不当行为、欺骗或误用，体现其对安全性的重视。尽管未披露训练数据来源，但模型训练数据聚焦于STEM、通识知识与编程内容，并过滤了化学、生物、核能等高风险领域信息。为推动开源生态安全，OpenAI还宣布将举办红队挑战赛，设立最高50万美元奖金，邀请全球开发者发现模型潜在漏洞。AWS、Azure、Baseten、Databricks等主流云平台已支持部署。 OpenAI CEO山姆·奥特曼表示：“我们很高兴将这项耗资数十亿美元的研发成果免费提供给世界，让AI惠及更多人。”他重申公司初心——确保通用人工智能（AGI）造福全人类，并称此举是构建“由美国主导、基于民主价值观的开放AI堆栈”的重要一步。尽管未公布与DeepSeek等模型的直接对比，但Reddit用户实测显示，在考虑工具调用的情况下，gpt-oss-120b在AIME任务中领先约5.7%，整体性能已具备全球竞争力。这一举措不仅为开发者、研究者和企业提供了强大且免费的AI基础设施，也标志着OpenAI从“闭源主导”向“开源协作”的战略转型，或将深刻影响未来AI技术的演进路径。

相关链接

相关链接

相关链接

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

Command Palette

OpenAI发布GPT-OSS，16GB内存即可在笔记本运行大模型

相关链接

Command Palette

OpenAI发布GPT-OSS，16GB内存即可在笔记本运行大模型

相关链接

Command Palette

OpenAI发布GPT-OSS，16GB内存即可在笔记本运行大模型

相关链接

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制