zai-org/GLM-5

GitHub: zai-org/GLM-5

GLM-5 是智谱推出的旗舰开源大语言模型系列，支持百万 token 上下文、高级编码与长周期智能体任务，专为复杂系统工程场景打造。

Stars: 3873 | Forks: 422

# GLM-5.2 & GLM-5.1 & GLM-5

👋 Join our Wechat or Discord community.
📖 Check out the GLM-5.2 blog and GLM-5 Technical report.
📍 Use GLM-5.2 API services on Z.ai API Platform.
🔜 Try GLM-5.2 at z.ai.

## 简介 ### GLM-5.2 GLM-5.2，我们用于长周期任务的最新旗舰模型。标志着其长周期任务能力相较于前身 GLM-5.1 取得了巨大飞跃，并首次在**坚实的 1M token 上下文**上提供该能力。 GLM-5.2 的新功能包括： - **坚实的 1M 上下文：** 坚实的 1M token 上下文，可稳定支持长周期工作 - **具有灵活计算力度的进阶编码**：更强大的编码能力，提供多种思考力度级别，以平衡性能与延迟 - **改进的架构**：我们提出了 [IndexShare](https://arxiv.org/abs/2603.12201)，它每四个 sparse attention 层重用同一个 indexer，在 1M 上下文长度下将每个 token 的 FLOPs 减少了 2.9 倍。我们还改进了 GLM-5.2 的 MTP 层以进行 speculative decoding，将接受长度（acceptance length）提高了多达 20% ![bench_52](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/1d745ec951195953.png) 在标准编码基准测试中，GLM-5.2 是最强大的开源模型，大幅领先于 GLM-5.1：在 Terminal-Bench 2.1 上为 81.0 对比 62.0，在 SWE-bench Pro 上为 62.1 对比 58.4。它还大幅缩小了与闭源前沿模型的差距——在 Terminal-Bench 2.1（81.0）上，它与 Claude Opus 4.8（85.0）仅相差几个点——同时保持领先于 Gemini 3.1 Pro。了解更多详情，请查阅我们的[博客](https://z.ai/blog/glm-5.2)。 ### GLM-5.1 ![bench_51](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/2257aaadd0200011.png) 但最有意义的飞跃超越了首轮的性能表现。以往的模型（包括 GLM-5）往往会过早耗尽它们的能力储备：它们应用熟悉的技术以获取初期的快速收益，随后便陷入瓶颈。给予它们更多的时间也于事无补。 ### GLM-5 我们推出了 GLM-5，旨在应对复杂的系统工程和长周期的 agentic 任务。扩展规模仍然是提升通用人工智能（AGI）智能效率的最重要途径之一。与 GLM-4.5 相比，GLM-5 的参数规模从 355B（激活 32B）扩展到了 744B（激活 40B），并将预训练数据从 23T 增加到 28.5T tokens。GLM-5 还集成了 DeepSeek Sparse Attention (DSA)，在保留长上下文能力的同时，大幅降低了部署成本。强化学习旨在弥合预训练模型中“胜任”与“卓越”之间的差距。然而，由于 RL 训练效率低下，在大规模 LLM 中部署它是一项挑战。为此，我们开发了 [slime](https://github.com/THUDM/slime)，这是一种新颖的**异步 RL 基础设施**，可显著提高训练吞吐量和效率，实现更细粒度的后训练迭代。凭借在预训练和后训练方面的进步，GLM-5 在广泛的学术基准测试中相较于 GLM-4.7 取得了显著提升，并在推理、编码和 agentic 任务上实现了全球所有开源模型中的最佳性能，缩小了与前沿模型的差距。 ![bench](https://raw.githubusercontent.com/zai-org/GLM-5/main/resources/bench.png) GLM-5 是专为复杂的系统工程和长周期 agentic 任务而构建的。在我们的内部评估套件 CC-Bench-V2 上，GLM-5 在前端、后端和长周期任务中均显著优于 GLM-4.7，缩小了与 Claude Opus 4.5 的差距。 ![realworld_bench](https://static.pigsec.cn/wp-content/uploads/repos/2026/06/379bf0c742200215.png) 在衡量长期运营能力的基准测试 [Vending Bench 2](https://andonlabs.com/evals/vending-bench-2) 上，GLM-5 在开源模型中排名第一。Vending Bench 2 要求模型在一年内运营模拟自动售货机业务；GLM-5 最终以 4,432 美元的账户余额结束，逼近 Claude Opus 4.5，展现了强大的长期规划和资源管理能力。 ![vending_bench](https://raw.githubusercontent.com/zai-org/GLM-5/main/resources/vending_bench.png) ## 下载模型 | 模型 | 下载链接 | 模型大小 | 精度 | |-------------|-------------------------------------------------------------------------------------------------------------------------------------|------------|-----------| | GLM-5.2 | [🤗 Hugging Face](https://huggingface.co/zai-org/GLM-5.2)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/GLM-5.2) | 744B-A40B | BF16 | | GLM-5.2-FP8 | [🤗 Hugging Face](https://huggingface.co/zai-org/GLM-5.2-FP8)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/GLM-5.2-FP8) | 744B-A40B | FP8 | | GLM-5.1 | [🤗 Hugging Face](https://huggingface.co/zai-org/GLM-5.1)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/GLM-5.1) | 744B-A40B | BF16 | | GLM-5.1-FP8 | [🤗 Hugging Face](https://huggingface.co/zai-org/GLM-5.1-FP8)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/GLM-5.1-FP8) | 744B-A40B | FP8 | | GLM-5 | [🤗 Hugging Face](https://huggingface.co/zai-org/GLM-5)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/GLM-5) | 744B-A40B | BF16 | | GLM-5-FP8 | [🤗 Hugging Face](https://huggingface.co/zai-org/GLM-5-FP8)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/GLM-5-FP8) | 744B-A40B | FP8 | ## 在本地部署 GLM-5 系列 GLM-5.2 支持使用以下框架进行部署。欢迎尝试： - [SGLang](https://github.com/sgl-project/sglang) (v0.5.13.post1+) — 见 [cookbook](https://cookbook.sglang.io/autoregressive/GLM/GLM-5.2) - [vLLM](https://github.com/vllm-project/vllm) (v0.23.0+) — 见 [recipes](https://recipes.vllm.ai/zai-org/GLM-5.2) - [Transformers](https://github.com/huggingface/transformers) (v0.5.12+) — 见 [transformers 文档](https://github.com/huggingface/transformers/blob/main/docs/source/en/model_doc/glm_moe_dsa.md) - [KTransformers](https://github.com/kvcache-ai/ktransformers) (v0.5.12+) — 见 [教程](https://github.com/kvcache-ai/ktransformers/blob/main/doc/en/kt-kernel/GLM-5.2-Tutorial.md) - 若在 `Ascend NPU` 平台上部署，支持 vLLM-Ascend、xLLM 和 SGLang 等推理框架 — 见[此处](example/ascend.md)。 GLM-5 支持通过 `reasoning_effort` 参数控制思考预算，该参数接受两个级别：`max` 和 `high`。**`max` 是默认值**——如果未设置 `reasoning_effort`（或设置为除 `high` 之外的任何值），模型将在 `Max` 级别下运行。要使用 `High` 级别，必须显式传入 `reasoning_effort="high"`。对于诸如复现基准测试/排行榜等默认场景，请保持使用 `Max`（无需设置）；仅在特定需要 `High` 级别时才设置 `reasoning_effort="high"`。可以通过设置 `enable_thinking=false` 完全关闭思考功能。 ## 引用如果您发现 GLM-5 系列模型对您的研究有用，请引用我们的技术报告： ``` @misc{glm5team2026glm5vibecodingagentic, title={GLM-5: from Vibe Coding to Agentic Engineering}, author={GLM-5-Team and : and Aohan Zeng and Xin Lv and Zhenyu Hou and Zhengxiao Du and Qinkai Zheng and Bin Chen and Da Yin and Chendi Ge and Chenghua Huang and Chengxing Xie and Chenzheng Zhu and Congfeng Yin and Cunxiang Wang and Gengzheng Pan and Hao Zeng and Haoke Zhang and Haoran Wang and Huilong Chen and Jiajie Zhang and Jian Jiao and Jiaqi Guo and Jingsen Wang and Jingzhao Du and Jinzhu Wu and Kedong Wang and Lei Li and Lin Fan and Lucen Zhong and Mingdao Liu and Mingming Zhao and Pengfan Du and Qian Dong and Rui Lu and Shuang-Li and Shulin Cao and Song Liu and Ting Jiang and Xiaodong Chen and Xiaohan Zhang and Xuancheng Huang and Xuezhen Dong and Yabo Xu and Yao Wei and Yifan An and Yilin Niu and Yitong Zhu and Yuanhao Wen and Yukuo Cen and Yushi Bai and Zhongpei Qiao and Zihan Wang and Zikang Wang and Zilin Zhu and Ziqiang Liu and Zixuan Li and Bojie Wang and Bosi Wen and Can Huang and Changpeng Cai and Chao Yu and Chen Li and Chengwei Hu and Chenhui Zhang and Dan Zhang and Daoyan Lin and Dayong Yang and Di Wang and Ding Ai and Erle Zhu and Fangzhou Yi and Feiyu Chen and Guohong Wen and Hailong Sun and Haisha Zhao and Haiyi Hu and Hanchen Zhang and Hanrui Liu and Hanyu Zhang and Hao Peng and Hao Tai and Haobo Zhang and He Liu and Hongwei Wang and Hongxi Yan and Hongyu Ge and Huan Liu and Huanpeng Chu and Jia'ni Zhao and Jiachen Wang and Jiajing Zhao and Jiamin Ren and Jiapeng Wang and Jiaxin Zhang and Jiayi Gui and Jiayue Zhao and Jijie Li and Jing An and Jing Li and Jingwei Yuan and Jinhua Du and Jinxin Liu and Junkai Zhi and Junwen Duan and Kaiyue Zhou and Kangjian Wei and Ke Wang and Keyun Luo and Laiqiang Zhang and Leigang Sha and Liang Xu and Lindong Wu and Lintao Ding and Lu Chen and Minghao Li and Nianyi Lin and Pan Ta and Qiang Zou and Rongjun Song and Ruiqi Yang and Shangqing Tu and Shangtong Yang and Shaoxiang Wu and Shengyan Zhang and Shijie Li and Shuang Li and Shuyi Fan and Wei Qin and Wei Tian and Weining Zhang and Wenbo Yu and Wenjie Liang and Xiang Kuang and Xiangmeng Cheng and Xiangyang Li and Xiaoquan Yan and Xiaowei Hu and Xiaoying Ling and Xing Fan and Xingye Xia and Xinyuan Zhang and Xinze Zhang and Xirui Pan and Xu Zou and Xunkai Zhang and Yadi Liu and Yandong Wu and Yanfu Li and Yidong Wang and Yifan Zhu and Yijun Tan and Yilin Zhou and Yiming Pan and Ying Zhang and Yinpei Su and Yipeng Geng and Yong Yan and Yonglin Tan and Yuean Bi and Yuhan Shen and Yuhao Yang and Yujiang Li and Yunan Liu and Yunqing Wang and Yuntao Li and Yurong Wu and Yutao Zhang and Yuxi Duan and Yuxuan Zhang and Zezhen Liu and Zhengtao Jiang and Zhenhe Yan and Zheyu Zhang and Zhixiang Wei and Zhuo Chen and Zhuoer Feng and Zijun Yao and Ziwei Chai and Ziyuan Wang and Zuzhou Zhang and Bin Xu and Minlie Huang and Hongning Wang and Juanzi Li and Yuxiao Dong and Jie Tang}, year={2026}, eprint={2602.15763}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2602.15763}, } ```

标签：Agentic Engineering, DLL 劫持, LLM, Unmanaged PE, 人工智能, 代码生成, 大语言模型, 渗透测试工具, 用户模式Hook绕过, 系统调用监控, 长上下文