Command Palette
Search for a command to run...
GLM-4.5: 에이전트, 추론 및 코딩(ARC) 기반 모델
GLM-4.5: 에이전트, 추론 및 코딩(ARC) 기반 모델
vLLM+Open WebUI를 사용하여 GLM-4.7-Flash 배포
초록
우리는 총 3550억 파라미터, 활성화된 파라미터 320억 개를 가진 오픈소스 전문가 혼합(Mixture-of-Experts, MoE) 대규모 언어 모델인 GLM-4.5를 소개합니다. 이 모델은 사고(Thinking) 모드와 직접 응답(Direct Response) 모드를 모두 지원하는 하이브리드 추론 방식을 특징으로 합니다. 23테라바이트(T) 토큰에 걸친 다단계 훈련과 전문가 모델 반복 최적화, 강화 학습을 통한 포스트-트레이닝을 거친 GLM-4.5는 에이전트 기반, 추론, 코딩(ARC) 등 다양한 과제에서 뛰어난 성능을 보이며, TAU-Bench에서 70.1%, AIME 2024에서 91.0%, SWE-bench Verified에서 64.2%의 점수를 기록했습니다. 여러 경쟁 모델들에 비해 훨씬 적은 파라미터 수를 가짐에도 불구하고, 평가된 모든 모델 중 전체 순위 3위, 에이전트 기반 벤치마크에서는 2위를 기록했습니다. 이를 통해 추론 및 에이전트 기반 AI 시스템 연구를 촉진하고자, GLM-4.5(3550억 파라미터)와 컴팩트 버전인 GLM-4.5-Air(1060억 파라미터)를 함께 공개합니다. 코드, 모델, 보다 자세한 정보는 https://github.com/zai-org/GLM-4.5 에서 확인할 수 있습니다.