GLM-5.2が知能指数ベンチで新トップ
Z.aiが最新の大規模言語モデル「GLM-5.2」を公開した。AI性能評価機関Artificial Analysisが発表するインテリジェンス指数v4.1において、同モデルは51点を記録し、MiniMax-M3やDeepSeek V4 Pro、Kimi K2.6を大きく引き離してオープンウェイトモデル首位にランクインした。 技術的仕様は前世代のGLM-5.1と同様の総パラメータ7440億、アクティブ400億のアーキテクチャを採用しているが、評価スコアは11ポイント向上した。特に科学推論や専門領域の課題で顕著な進化を見せ、CritPtやHLE、金融分析タスク、コーディングテストなど主要ベンチマークで大幅な得点アップを達成した。また、コンテキストウィンドウは従来の20万トークンから100万トークンに拡張され、長期タスクの処理能力が強化されている。 実環境でのエージェント性能を示すGDPval-AA v2では1524点を記録し、プロプライエタリモデルのGPT-5.5とほぼ同等の水準に達した。情報正確性とハルシネーション率の改善により、AA-オムニシェンス指数も2から4へと評価を上げた。一方、1タスクあたりの平均出力トークン数は4.3万に達し、知能と効率性を比較した指標ではやや非効率な部類に入るものの、知能度とタスク単価のパレート最適線上に位置し、同等の知能レベルを提供するモデルの中で最もコスト効率に優れている。 利用環境はMITライセンスで公開され、Z.ai公式APIに加え、DeepInfraやNovita、Fireworksなど主要クラウドおよび推論プラットフォームでも提供が開始された。API料金は入力トークン100万あたり1.4ドル、出力4.4ドル、キャッシュ命中0.26ドルに設定されている。 GLM-5.2の登場は、高コストなクローズドソースモデルへの依存を緩和しつつ、高度な推論とエージェント機能をオープンウェイト環境で実現可能にした点に意義がある。実務レベルでのエージェント運用や専門分野の自動化において、新たな業界基準を形成することが期待される。
