HyperAIHyperAI

Command Palette

Search for a command to run...

GLM-5重磅发布

2026年2月11日,正值农历新年前夕,中国人工智能公司Zhipu AI正式发布其最新前沿大模型GLM-5。该模型迅速登顶Artificial Analysis榜单第一,成为当前性能最强的开源模型,并在LMArena Text Arena中以1452分位列所有模型第11名,领先于多数闭源模型。 GLM-5是一款7440亿参数的混合专家(MoE)模型,每token激活约400亿参数,相较前代GLM-4.5实现约2倍规模提升。训练数据从23万亿增至28.5万亿token,并采用DeepSeek开发的稀疏注意力机制(DSA),支持高达20万token的上下文窗口。模型已开源,采用MIT协议发布于Hugging Face,同时可通过Zhipu API及OpenRouter平台访问。 令人瞩目的是,GLM-5完全基于华为Ascend芯片和MindSpore框架训练,未使用任何NVIDIA硬件。这一成就尤为关键——Zhipu自2025年1月起被列入美国实体清单,被禁止获取H100/H200等高端GPU。其成功表明,中国已具备在制裁环境下构建前沿AI模型的完整本土算力生态。 在性能方面,GLM-5在SWE-bench Verified上取得77.8%的准确率,超越Gemini 3 Pro和GPT-5.2,接近Claude Opus 4.5。在AIME 2026、GPQA-Diamond、BrowseComp、Vending Bench 2和MCP-Atlas等多个任务中均领先开源模型。尤其值得关注的是,其在AA-Omniscience Index(认知边界指数)中取得-1分,较前代提升35分,反映出其在“承认未知”方面显著优于幻觉频发的旧模型。 此前,OpenRouter悄然上线名为“Pony Alpha”的匿名模型,具备20万token上下文,首日处理超400亿token。社区迅速推测其为GLM-5的预发布测试版本。Zhipu借此完成真实用户压力测试,为正式发布积累反馈,策略巧妙。 定价方面,GLM-5 API输入价为每百万token1美元,输出价3.2美元,分别约为Claude Opus 4.6的1/5和1/8,极具性价比。尽管如此,其部署成本极高,需至少8张H200/H20显卡进行FP8推理,对绝大多数团队而言仅适合通过API调用。

相关链接