HyperAIHyperAI

Command Palette

Search for a command to run...

2 天前
LLM
基准

GLM-5.2成Artificial Analysis智能指数榜首开源模型

近日,智谱AI旗下大语言模型GLM-5.2在Artificial Analysis智能指数v4.1评测中斩获51分,强势登顶开源权重模型榜首,综合表现超越MiniMax-M3、DeepSeek V4 Pro及Kimi K2.6等头部竞品。该模型沿用744B总参数量与40B激活参数架构,但智能水平实现显著跃升,尤其在科学推理领域进步突出,CritPt与HLE基准得分分别大幅上涨16分与12分,同时在金融逻辑、代码生成及复杂终端任务中均取得突破。在智能体实战评估GDPval-AA v2中,GLM-5.2取得1524分,稳居开源第一,并成功追平GPT-5.5等闭源旗舰。技术层面,模型上下文窗口扩容至100万tokens,幻觉率降至28.1%,并正式采用MIT协议开源,全面支持官方API及第三方生态调用。尽管因强化推理机制导致单任务平均消耗4.3万输出tokens,单次成本约0.46美元,但其凭借极致的推理质量精准落于智能与成本效益的帕累托前沿。此举进一步印证了国产开源模型在长窗口与高难度逻辑推演赛道已具备全球顶尖竞争力。

相关链接