HyperAIHyperAI

Command Palette

Search for a command to run...

GLM-4.5:智能体、推理与编程(ARC)基础模型

Abstract

我们推出开源的混合专家(Mixture-of-Experts, MoE)大语言模型 GLM-4.5,该模型总参数量达 3550 亿,激活参数量为 320 亿,采用混合推理机制,支持思维链(thinking)与直接响应(direct response)两种模式。通过在 23TB 令牌上进行多阶段训练,并结合专家模型迭代与强化学习的全面后训练,GLM-4.5 在代理型(agentic)、推理与编程(ARC)任务中均展现出卓越性能,在 TAU-Bench 上取得 70.1% 的得分,在 AIME 2024 上达到 91.0%,在 SWE-bench Verified 任务中获得 64.2% 的成绩。相较于多个同类竞品,GLM-4.5 所用参数显著更少,但在所有评估模型中综合排名第三,在代理型基准测试中位列第二。为推动推理与代理型人工智能系统的研究,我们同时发布两个版本:全量模型 GLM-4.5(3550 亿参数)与轻量版本 GLM-4.5-Air(1060 亿参数)。相关代码、模型及更多信息请访问:https://github.com/zai-org/GLM-4.5


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供