HyperAI

2026年2月11日，正值农历新年前夕，中国人工智能公司Zhipu AI正式发布其最新前沿大模型GLM-5。该模型迅速登顶Artificial Analysis榜单第一，成为当前性能最强的开源模型，并在LMArena Text Arena中以1452分位列所有模型第11名，领先于多数闭源模型。 GLM-5是一款7440亿参数的混合专家（MoE）模型，每token激活约400亿参数，相较前代GLM-4.5实现约2倍规模提升。训练数据从23万亿增至28.5万亿token，并采用DeepSeek开发的稀疏注意力机制（DSA），支持高达20万token的上下文窗口。模型已开源，采用MIT协议发布于Hugging Face，同时可通过Zhipu API及OpenRouter平台访问。令人瞩目的是，GLM-5完全基于华为Ascend芯片和MindSpore框架训练，未使用任何NVIDIA硬件。这一成就尤为关键——Zhipu自2025年1月起被列入美国实体清单，被禁止获取H100/H200等高端GPU。其成功表明，中国已具备在制裁环境下构建前沿AI模型的完整本土算力生态。在性能方面，GLM-5在SWE-bench Verified上取得77.8%的准确率，超越Gemini 3 Pro和GPT-5.2，接近Claude Opus 4.5。在AIME 2026、GPQA-Diamond、BrowseComp、Vending Bench 2和MCP-Atlas等多个任务中均领先开源模型。尤其值得关注的是，其在AA-Omniscience Index（认知边界指数）中取得-1分，较前代提升35分，反映出其在“承认未知”方面显著优于幻觉频发的旧模型。此前，OpenRouter悄然上线名为“Pony Alpha”的匿名模型，具备20万token上下文，首日处理超400亿token。社区迅速推测其为GLM-5的预发布测试版本。Zhipu借此完成真实用户压力测试，为正式发布积累反馈，策略巧妙。定价方面，GLM-5 API输入价为每百万token1美元，输出价3.2美元，分别约为Claude Opus 4.6的1/5和1/8，极具性价比。尽管如此，其部署成本极高，需至少8张H200/H20显卡进行FP8推理，对绝大多数团队而言仅适合通过API调用。

相关链接

相关链接

相关链接

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑

Command Palette

GLM-5重磅发布

相关链接

Command Palette

GLM-5重磅发布

相关链接

Command Palette

GLM-5重磅发布

相关链接

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑

在线教程｜27B 大模型压缩到 7.2GB！Ternary-Bonsai 用「三进制魔法」让大模型跑进个人电脑