GLM-5.1-Turbo 发布后不久,智谱的 Coding Plan 服务便宣布了对该模型的支持。 
我随即在 Claude Code 中切换至 GLM-5.1 模型进行了深度体验。经过数日的密集测试,我发现 GLM-5.1 并非一次简单的迭代升级,其能力,尤其是在处理长程任务方面,表现出了显著的代际跨越。
根据 Artificial Analysis、SWE Bench 等核心基准测试榜单,GLM-5.1 目前位列开源模型榜首。
01 实测:三大长程任务挑战
我在 Claude Code 中设置了三个不同类型的长程任务,每个任务都涉及多步骤、长链路且需要持续执行。GLM-5.1 模型从第一步到最后一步,全程保持了目标的一致性,没有出现偏离。

任务一:从零开发一个支持 Web 和 CLI 的笔记工具
结合 Superpowers 插件,使用 GLM-5.1 从零到一开发应用效率极高。整个过程始于一次前置的头脑风暴,以明确需求范围、技术选型等关键事项。
① 前置头脑风暴
我输入了简要的需求:“从零开发一个类似 memo 的本地笔记工具,支持 Web 端笔记创建、编辑、删除、搜索。同时提供 CLI 命令可以在终端里面操作笔记。支持标签系统,数据保存到本地。”

输入提示词后,GLM-5.1 并未立即开始编码,而是首先与我进行对话,逐一确认需求细节和技术选型。在讨论核心界面 UI 时,它甚至生成了一个临时的网页供我选择偏好。

② 制定详细计划
头脑风暴结束后,模型开始制定一份详细的开发计划,该计划会直接落实到具体的文件结构中。 
确认计划无误后,我告知模型可以开始执行,随后便离开了。
③ 自主执行开发
模型随后启动了多个子代理(Agent),自主完成了整个项目的开发。在此期间,我未进行任何人工干预。 
大约一小时后,模型返回了完成通知。 
④ 成果验收
包含头脑风暴在内,总计耗时约 1 小时。一个包含 46 个文件、5258 行代码的笔记工具便开发完成,且一次验证通过。
部署后,所有核心功能均可用,包括笔记的创建/编辑/删除、标签自动解析、全文搜索、日历视图以及 CLI 操作等。
CLI 操作示例如下:

任务二:10 万条用户数据的场景分析
这是一个典型的数据分析任务。我本地有一个包含 10 万条 用户文件名称记录的 CSV 文件,目标是让 AI 读取数据,基于文件名称进行用户使用场景分类,并输出分析洞察。

在此任务中,我同样先启用了“头脑风暴”模式。模型会基于任务背景不断提问,以澄清真实的诉求。 
在让我澄清了 5 次细节,并提供了 3 种分类方案后,模型自主完成了对 10 万条数据的打标工作,最终交付了一份详尽的分析报告。

这种遇到问题自行处理、而非将问题抛回给用户的行为模式,是长程任务中最宝贵的能力之一。
任务三:开源项目 PR/Issues 批量管理
我给予模型一个开源仓库地址,要求其阅读所有处于 Open 状态的 PR,并制定完整的管理方案(包括遍历、评估、冲突解决等),输出可执行的计划。

整个任务由模型自主规划了 40 多个步骤,持续执行约 11 分钟,消耗了约 1800 万 Token。 
过程中有几个细节令人印象深刻:其计划非常周全,不仅包括功能更新,还计划同步更新中英文的 ReadMe 文件;最后,它还会模拟维护者口吻,为提交 PR 的开发者生成感谢评论。 
02 如何启用 GLM-5.1
若你已是智谱 Coding Plan 用户,可通过以下方式在 Claude Code 中启用 GLM 模型:
方法一:手动配置
找到 Claude Code 的配置文件 ~/.claude/settings.json,将 model 字段修改为 glm-5.1,保存即可。
方法二:使用 CC Switch 一键切换
CC Switch 是一个开源的桌面端 AI 编程工具管理器,可统一管理多个工具的 Provider。
只需点击右上角“+”号,填入你的 Coding Plan API Key 及模型名称 glm-5.1 即可。 
03 长程任务:AI 编程的演进方向
GLM-5.1 的定位非常明确:它是目前面向长程任务的开源第一模型,其在此类任务上的体验可媲美顶级闭源模型。
AI 编程正经历一条清晰的能力跃迁路径:
* 第一阶段:AI 辅助编程:模型学会写代码,成为程序员的效率工具,用于生成函数或代码片段。
* 第二阶段:氛围编程(Vibe Coding):编程从专业行为变为大众表达方式。用户无需理解每行代码,即可借助工具将想法快速转化为原型。
* 第三阶段:智能体(Agentic):AI 能自主理解需求、制定计划、编写代码、测试并迭代修复,扮演初级工程师的角色。
* 第四阶段:长视野(Long Horizon):解决真实世界中有价值的复杂任务。这些任务需要跨步骤、跨工具、跨时间持续推进,要求 AI 能记住上下文、保持目标一致、处理意外并修正路径。
GLM-5.1 正是瞄准了第四阶段。
在深度体验后,一个问题浮现:在 AI 时代,人类更擅长的是什么?
当 Opus、GLM-5.1 这类模型出现后,AI 不仅替代了“手”(执行),也开始替代“脑”(规划与决策)。你只需给定目标,它便能自行拆解步骤、推进执行、中途修复问题并最终交付成果。只要提供足够的上下文,AI 做出的许多判断甚至优于人力。

关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/28272


