2 个月前

自然语言处理

摘要

我们推出开源的混合专家（Mixture-of-Experts, MoE）大语言模型 GLM-4.5，该模型总参数量达 3550 亿，激活参数量为 320 亿，采用混合推理机制，支持思维链（thinking）与直接响应（direct response）两种模式。通过在 23TB 令牌上进行多阶段训练，并结合专家模型迭代与强化学习的全面后训练，GLM-4.5 在代理型（agentic）、推理与编程（ARC）任务中均展现出卓越性能，在 TAU-Bench 上取得 70.1% 的得分，在 AIME 2024 上达到 91.0%，在 SWE-bench Verified 任务中获得 64.2% 的成绩。相较于多个同类竞品，GLM-4.5 所用参数显著更少，但在所有评估模型中综合排名第三，在代理型基准测试中位列第二。为推动推理与代理型人工智能系统的研究，我们同时发布两个版本：全量模型 GLM-4.5（3550 亿参数）与轻量版本 GLM-4.5-Air（1060 亿参数）。相关代码、模型及更多信息请访问：https://github.com/zai-org/GLM-4.5。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

2 个月前

自然语言处理

摘要

我们推出开源的混合专家（Mixture-of-Experts, MoE）大语言模型 GLM-4.5，该模型总参数量达 3550 亿，激活参数量为 320 亿，采用混合推理机制，支持思维链（thinking）与直接响应（direct response）两种模式。通过在 23TB 令牌上进行多阶段训练，并结合专家模型迭代与强化学习的全面后训练，GLM-4.5 在代理型（agentic）、推理与编程（ARC）任务中均展现出卓越性能，在 TAU-Bench 上取得 70.1% 的得分，在 AIME 2024 上达到 91.0%，在 SWE-bench Verified 任务中获得 64.2% 的成绩。相较于多个同类竞品，GLM-4.5 所用参数显著更少，但在所有评估模型中综合排名第三，在代理型基准测试中位列第二。为推动推理与代理型人工智能系统的研究，我们同时发布两个版本：全量模型 GLM-4.5（3550 亿参数）与轻量版本 GLM-4.5-Air（1060 亿参数）。相关代码、模型及更多信息请访问：https://github.com/zai-org/GLM-4.5。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供