Command Palette
Search for a command to run...
GLM-4.5:エージェント機能、推論能力、コーディングを備えたARC基盤モデル
GLM-4.5:エージェント機能、推論能力、コーディングを備えたARC基盤モデル
Abstract
GLM-4.5は、合計3550億パラメータ、有効激活パラメータ数320億のオープンソースMixture-of-Experts(MoE)型大規模言語モデルであり、思考モードと即時応答モードの両方をサポートするハイブリッド推論方式を特徴としています。23テラトークンにわたる段階的学習と、専門モデルの反復最適化および強化学習を用いた包括的な微調整を経て、GLM-4.5はエージェンティックなタスク、推論タスク、およびコード生成(ARC)タスクにおいて優れた性能を発揮し、TAU-Benchで70.1%、AIME 2024で91.0%、SWE-bench Verifiedで64.2%のスコアを達成しました。多数の競合モデルと比較してはるかに少ないパラメータ数で、評価対象モデル全体では3位、エージェンティックベンチマークでは2位の成績を収めています。本研究では、GLM-4.5(3550億パラメータ)に加え、よりコンパクトなバージョンであるGLM-4.5-Air(1060億パラメータ)も公開し、推論およびエージェント型AIシステムに関する研究を促進することを目的としています。コード、モデル、および詳細情報は、https://github.com/zai-org/GLM-4.5 にて公開されています。