OpenAI发布开源大模型,性能接近o4-mini
OpenAI在周二正式发布两款全新的开源权重语言模型——gpt-oss-120b与gpt-oss-20b,标志着该公司自2019年发布GPT-2以来,首次推出开放权重的大型语言模型。这两款模型可免费下载、自由修改,并能在个人电脑甚至低端硬件上运行,旨在增强开发者、研究机构与企业的自主性与创新能力。 所谓“开放权重”模型,是指模型的训练参数(即决定其输出表现的核心数据)向公众公开,允许用户在本地或云端对其进行微调、部署和定制,但不包括完整源代码。这与“开源模型”不同,后者提供全部代码,而开放权重更侧重于参数的透明与可访问性。目前,Meta的Llama系列、中国AI公司DeepSeek以及Mistral等均采用类似策略,推动AI生态的开放发展。 OpenAI此次的举措被视为对市场压力的回应。此前,公司CEO萨姆·阿尔特曼在年初承认,其长期封闭策略“站在了历史的错误一边”,尤其是在DeepSeek等竞争对手以高性能、低成本的开放模型迅速抢占市场的情况下。阿尔特曼表示,OpenAI的使命始终是确保人工通用智能(AGI)造福全人类,而开放模型是实现这一目标的重要路径。 两款新模型分别拥有1200亿和200亿参数。其中,gpt-oss-120b可在单块Nvidia GPU上运行,性能接近OpenAI的闭源推理模型o4-mini;而gpt-oss-20b仅需16GB内存,即可在普通笔记本电脑上运行,性能对标o3-mini。两者均支持复杂推理、代码生成、联网搜索和工具调用,可通过Hugging Face、GitHub、AWS、Azure、Snowflake、Orange等平台获取,并采用Apache 2.0许可,允许商业使用。 为应对安全风险,OpenAI强调,gpt-oss系列是其迄今为止经过最严格安全测试的模型。训练过程中已过滤有害的化学、生物、核辐射等敏感信息,并通过模拟恶意微调攻击进行验证,结果显示,即便被恶意操控,模型也难以达到高危害能力阈值。公司还邀请三家外部安全机构参与评估,确保模型在网络安全、生物武器等高风险领域的安全性。 OpenAI并未公布与Llama、DeepSeek或Gemma等模型的直接性能对比,但称其在编码任务和“人类最后考试”(Humanity’s Last Exam)等测试中表现优异。公司希望此举能降低AI技术门槛,激发更多创新,尤其惠及中小开发者和资源有限的团队。 尽管OpenAI仍保留其营利性子公司,但其整体架构维持非营利属性,由非营利董事会监督,以回应早期关于商业化偏离初心的争议。此次发布不仅标志着战略转向,也预示着全球AI竞争正从封闭垄断走向开放协作的新阶段。