GLM-5.1：从 Vibe Coding 走向智能体工程

GLM-5.1 是新一代的旗舰级大模型，专门为智能体工程 (Agentic Engineering) 而设计。相比于前代产品，GLM-5.1 在代码生成和复杂工程任务中实现了质的飞跃，旨在将 LLM 从简单的对话工具转变为能够独立处理复杂软件工程任务的专业智能体。

核心进化：超越“首遍性能”

大多数模型在处理复杂任务时，往往在初期能通过熟悉的技巧获得快速提升，但随后会陷入平台期。而 GLM-5.1 的核心突破在于其长程任务的持续有效性。

GLM-5.1 不再仅仅依赖于单次输出的正确性，而是在长周期的任务中保持高效：

在最苛刻的软件工程基准测试中，GLM-5.1 展现了顶尖的性能：

GLM-5.1 在多项高难度基准测试中处于世界领先水平：

维度	基准测试	GLM-5.1 成绩	核心能力
代码工程	SWE-Bench Pro	58.4	真实世界软件工程能力
代码工程	NL2Repo	42.7	仓库级代码生成
终端操控	Terminal-Bench 2.0	63.5	真实命令行交互能力
复杂推理	HLE (w/ Tools)	52.3	结合工具的高阶逻辑推理
数学能力	AIME 2026	95.3	竞赛级数学问题求解
网络浏览	BrowseComp (w/ Context)	79.3	复杂网页信息检索与处理

为了方便开发者快速上手，GLM-5.1 广泛支持主流的开源部署框架：

SGLang (v0.5.10+)
vLLM (v0.19.0+)
xLLM (v0.8.0+)
Transformers (v0.5.3+)
KTransformers (v0.5.3+)

相关链接：