HyperAIHyperAI

Command Palette

Search for a command to run...

GLM-5.2: KI-Modell verarbeitet Langzeitaufgaben mit 1M Kontext

Zhipu AI hat mit GLM-5.2 sein neues Flaggschiff-Modell vorgestellt, das maßgeblich auf die Bewältigung von Langzeitaufgaben mit bis zu einer Million Tokens Kontextlänge ausgelegt ist. Das Update stellt einen signifikanten Sprung gegenüber GLM-5.1 dar und zielt darauf ab, die oft fragile Leistung von KI-Agenten in komplexen, mehrstufigen Entwicklungsprozessen zu stabilisieren. Um den 1M-Token-Kontext unter realen Engineering-Bedingungen stabil zu halten, setzen Entwickler auf die IndexShare-Technologie, die bei DSA-Architekturen und MTP-Schichten die Rechenlast signifikant senkt. Ergänzend kommen KV-Share und eine optimierte Ablehnungsstichproben-Methode zum Einsatz, was die Akzeptanzrate beim spekulativen Dekodieren steigert. Für das Serving optimierte das Team die Speicherverwaltung und CPU-seitige Pipelines, wodurch Durchsatz und Parallelität bei langen Kontexten deutlich steigen. Das interne SLIME-Framework koordiniert dabei das Training großer agenterbasierter RL-Workloads und ermöglicht die effiziente Integration über zehn Expertennetze. In langfristigen Coding-Benchmarks wie FrontierSWE und PostTrainBench positioniert sich GLM-5.2 als stärkstes Open-Source-Modell und liegt deutlich vor Vorgängerarchitekturen sowie einigen proprietären Konkurrenten. Eine neue Steuerung der Rechenintensität erlaubt Nutzern, zwischen Standard- und Maximalleistung zu wählen, wodurch sich Leistung und Kosten flexibel abwägen lassen. Um das Training vor Reward Hacking zu schützen, führt das Team einen zweistufigen Anti-Hack-Modus ein, der verdächtige API-Aufrufe und Zugriffsmuster erkennt, blockiert und durch Dummy-Antworten ersetzt, ohne den Trainingsfortschritt zu unterbrechen. GLM-5.2 ist ab sofort über die Z.ai-Plattform und die Desktop-Anwendung ZCode nutzbar. Die Modellgewichte werden öffentlich auf Hugging Face und ModelScope bereitgestellt und sind mit führenden Inference-Frameworks wie vLLM, SGLang und Transformers kompatibel. Für Abonnenten des GLM Coding Plan gelten angepasste Quotenregelungen, wobei zeitweise reduzierte Kosten in Stoß- und Nebenzeiten angeboten werden. Mit der Veröffentlichung festigt Zhipu AI seine Position im Open-Source-Ökosystem und adressiert zugleich die praktischen Anforderungen an robuste, langfristige KI-gestützte Softwareentwicklung.

Verwandte Links