Back to Headlines

OpenAI发布GPT-OSS,16GB内存即可在笔记本运行大模型

3 天前

OpenAI 在经历数周预热后,于当地时间8月5日正式发布两款全新的开源推理模型:gpt-oss-120b 和 gpt-oss-20b,分别拥有约1170亿和210亿参数。这两款模型均采用Apache 2.0开源许可协议,可在Hugging Face等平台免费下载,支持商业用途、自由修改与再分发,并以MXFP4原生量化格式提供,显著降低部署门槛。 尽管OpenAI此前长期以闭源为主,上一次开放权重还要追溯到2019年的GPT-2,但此次发布标志着其在开源战略上的重大转向。尤其在DeepSeek、Qwen等中国开源模型迅速崛起、引发全球关注的背景下,OpenAI此举被视为对开源生态竞争压力的直接回应。 两款模型均采用稀疏专家(MoE)架构:gpt-oss-120b包含128个专家,每token激活4个;gpt-oss-20b则有32个专家。两者上下文窗口均为128k,支持思维链(Chain-of-Thought)、结构化输出和工具调用,可无缝集成OpenAI的Responses API,适用于构建复杂代理系统。 性能方面,gpt-oss-120b在多项推理任务(如AIME、GPQA、MMLU)中表现接近甚至超越OpenAI专有模型o4-mini,且在SWE-bench、Codeforces等代码与工具调用任务中展现出强大能力,甚至在HealthBench测试中超越GPT-4o和o1。gpt-oss-20b虽参数较小,但仅需16GB显存即可在笔记本电脑上本地运行,适合快速开发与迭代。 值得注意的是,两款模型的思维链为无监督设计,OpenAI强调此举有助于研究人员自主构建推理监控机制,以识别潜在的不当行为、欺骗或误用,体现其对安全性的重视。尽管未披露训练数据来源,但模型训练数据聚焦于STEM、通识知识与编程内容,并过滤了化学、生物、核能等高风险领域信息。 为推动开源生态安全,OpenAI还宣布将举办红队挑战赛,设立最高50万美元奖金,邀请全球开发者发现模型潜在漏洞。AWS、Azure、Baseten、Databricks等主流云平台已支持部署。 OpenAI CEO山姆·奥特曼表示:“我们很高兴将这项耗资数十亿美元的研发成果免费提供给世界,让AI惠及更多人。”他重申公司初心——确保通用人工智能(AGI)造福全人类,并称此举是构建“由美国主导、基于民主价值观的开放AI堆栈”的重要一步。 尽管未公布与DeepSeek等模型的直接对比,但Reddit用户实测显示,在考虑工具调用的情况下,gpt-oss-120b在AIME任务中领先约5.7%,整体性能已具备全球竞争力。 这一举措不仅为开发者、研究者和企业提供了强大且免费的AI基础设施,也标志着OpenAI从“闭源主导”向“开源协作”的战略转型,或将深刻影响未来AI技术的演进路径。

Related Links