AMD与高通官宣硬件全面支持GPT-OSS系列开放模型
19 天前
AMD与高通近日联合宣布,其旗下硬件已正式支持OpenAI推出的gpt-oss系列开放推理模型,标志着AI与边缘计算融合迈出关键一步。该系列包含两款模型:参数量较小的gpt-oss-20b和更复杂的gpt-oss-120b。前者可在配备16GB内存的设备上流畅运行,后者则可在单张80GB显卡上高效执行。 AMD表示,其锐龙AI Max+395处理器成为全球首款支持运行gpt-oss-120b模型的消费级AI PC处理器。为实现这一突破,AMD采用GGML框架与MXFP4量化格式,使模型在约61GB显存下稳定运行。配合“Strix Halo”平台的128GB统一内存架构,系统可将96GB内存分配给GPU,满足高负载需求。在性能方面,锐龙AI Max+395运行gpt-oss-120b时可实现每秒30个Token的输出速度,并支持MCP模型上下文协议,显著提升复杂任务的响应效率与处理能力。 高通方面则透露,gpt-oss-20b在骁龙平台上的早期测试中展现出优异的思维链推理能力。开发者可通过Hugging Face、Ollama等主流平台,在搭载骁龙芯片的设备上便捷部署和使用该模型,充分发挥其在移动端的潜力。 此次合作不仅彰显了AMD与高通在AI硬件领域的前瞻性布局,也推动了大模型向终端设备下沉。随着gpt-oss系列模型在更多设备上的落地,用户将能体验到更智能、更快速、更本地化的AI应用,为边缘AI的普及与创新开辟广阔前景。
Related Links
MIT Technology Review