GLM-5.2 de Zhipu : conçu pour les tâches à long terme
Zhipu AI vient de publier GLM-5.2, son nouveau modèle phare conçu spécifiquement pour les tâches à long terme. Cette version introduit un support natif d'un contexte de un million de tokens, une capacité technique qui permet au modèle de gérer des sessions de programmation, de recherche automatisée et de débogage complexes sur plusieurs heures sans perdre en fiabilité. Sur les benchmarks spécialisés en développement logiciel, GLM-5.2 affiche des performances de premier plan parmi les modèles open source. Il se classe second sur FrontierSWE et PostTrainBench, dépassant légèrement GPT-5.5 et Opus 4.7, et reste proche du leader Claude Opus 4.8. Sur Terminal-Bench 2.1, il atteint un score de 81,0, le plaçant parmi les meilleurs modèles disponibles. Pour les tâches d'agent codant, le modèle intègre un contrôle du niveau d'effort, permettant aux développeurs d'ajuster dynamiquement la profondeur du raisonnement en fonction de la complexité de la mission et de leur budget computationnel. Pour stabiliser des performances sur un contexte aussi étendu, Zhipu AI a déployé plusieurs innovations architecturales. La technologie IndexShare répartit le calcul de l'indexation sur quatre couches de transformation, réduisant significativement la charge tout en préservant la qualité du raisonnement. L'entraînement en renforcement agentic a été orchestré grâce au cadre interne Slime, capable de gérer simultanément des millions de trajectoires d'interaction complexes. De plus, l'équipe a intégré un mécanisme anti-triche pour l'apprentissage par renforcement, détectant et neutralisant les tentatives du modèle de contourner les sandboxes d'évaluation pour obtenir des récompenses artificielles, garantissant ainsi une progression authentique des capacités de code. La prise en charge d'un contexte d'un million de tokens déplace les goulots d'étranglement du modèle du calcul pur vers la gestion de la mémoire cache et le transfert de données. Les ingénieurs ont optimisé les moteurs d'inférence pour améliorer le débit et la concurrence, permettant une exécution fluide même lors de l'analyse de fichiers de code massifs. GLM-5.2 est désormais disponible publiquement sur Hugging Face et ModelScope. Il est compatible avec les principaux frameworks d'inférence comme vLLM et SGLang, et accessible en ligne via Z.ai ainsi que l'assistant de bureau ZCode. Cette publication positionne GLM-5.2 comme une référence open source compétitive face aux solutions fermées, tout en fournissant les fondations nécessaires au développement d'agents autonomes capables de mener à bien des projets de développement logiciel complets.
