HyperAI

OpenAI在周二正式发布两款全新的开源权重语言模型——gpt-oss-120b与gpt-oss-20b，标志着该公司自2019年发布GPT-2以来，首次推出开放权重的大型语言模型。这两款模型可免费下载、自由修改，并能在个人电脑甚至低端硬件上运行，旨在增强开发者、研究机构与企业的自主性与创新能力。所谓“开放权重”模型，是指模型的训练参数（即决定其输出表现的核心数据）向公众公开，允许用户在本地或云端对其进行微调、部署和定制，但不包括完整源代码。这与“开源模型”不同，后者提供全部代码，而开放权重更侧重于参数的透明与可访问性。目前，Meta的Llama系列、中国AI公司DeepSeek以及Mistral等均采用类似策略，推动AI生态的开放发展。 OpenAI此次的举措被视为对市场压力的回应。此前，公司CEO萨姆·阿尔特曼在年初承认，其长期封闭策略“站在了历史的错误一边”，尤其是在DeepSeek等竞争对手以高性能、低成本的开放模型迅速抢占市场的情况下。阿尔特曼表示，OpenAI的使命始终是确保人工通用智能（AGI）造福全人类，而开放模型是实现这一目标的重要路径。两款新模型分别拥有1200亿和200亿参数。其中，gpt-oss-120b可在单块Nvidia GPU上运行，性能接近OpenAI的闭源推理模型o4-mini；而gpt-oss-20b仅需16GB内存，即可在普通笔记本电脑上运行，性能对标o3-mini。两者均支持复杂推理、代码生成、联网搜索和工具调用，可通过Hugging Face、GitHub、AWS、Azure、Snowflake、Orange等平台获取，并采用Apache 2.0许可，允许商业使用。为应对安全风险，OpenAI强调，gpt-oss系列是其迄今为止经过最严格安全测试的模型。训练过程中已过滤有害的化学、生物、核辐射等敏感信息，并通过模拟恶意微调攻击进行验证，结果显示，即便被恶意操控，模型也难以达到高危害能力阈值。公司还邀请三家外部安全机构参与评估，确保模型在网络安全、生物武器等高风险领域的安全性。 OpenAI并未公布与Llama、DeepSeek或Gemma等模型的直接性能对比，但称其在编码任务和“人类最后考试”（Humanity’s Last Exam）等测试中表现优异。公司希望此举能降低AI技术门槛，激发更多创新，尤其惠及中小开发者和资源有限的团队。尽管OpenAI仍保留其营利性子公司，但其整体架构维持非营利属性，由非营利董事会监督，以回应早期关于商业化偏离初心的争议。此次发布不仅标志着战略转向，也预示着全球AI竞争正从封闭垄断走向开放协作的新阶段。