HyperAIHyperAI

Command Palette

Search for a command to run...

GLM-4.5:エージェント機能、推論能力、コーディングを備えたARC基盤モデル

Abstract

GLM-4.5は、合計3550億パラメータ、有効激活パラメータ数320億のオープンソースMixture-of-Experts(MoE)型大規模言語モデルであり、思考モードと即時応答モードの両方をサポートするハイブリッド推論方式を特徴としています。23テラトークンにわたる段階的学習と、専門モデルの反復最適化および強化学習を用いた包括的な微調整を経て、GLM-4.5はエージェンティックなタスク、推論タスク、およびコード生成(ARC)タスクにおいて優れた性能を発揮し、TAU-Benchで70.1%、AIME 2024で91.0%、SWE-bench Verifiedで64.2%のスコアを達成しました。多数の競合モデルと比較してはるかに少ないパラメータ数で、評価対象モデル全体では3位、エージェンティックベンチマークでは2位の成績を収めています。本研究では、GLM-4.5(3550億パラメータ)に加え、よりコンパクトなバージョンであるGLM-4.5-Air(1060億パラメータ)も公開し、推論およびエージェント型AIシステムに関する研究を促進することを目的としています。コード、モデル、および詳細情報は、https://github.com/zai-org/GLM-4.5 にて公開されています。


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
GLM-4.5:エージェント機能、推論能力、コーディングを備えたARC基盤モデル | Papers | HyperAI超神経