Agentic Coding

大模型工程

华为CLI-Gym：首个公开的Terminal-Bench环境交互任务数据规模化方案，解决率提升20%

「首个公开的面向 Terminal-Bench 环境交互类任务的数据规模化生产管线正式发布！」开源完整自动化数据构建算法构建 1655 个高可靠 CLI 任务环境镜像通过 291 条轨迹数据带来 20% 解决率提升在 Agentic Coding 领域，基于 SWE-bench 的数据管线研究已取得长足进展。过去一年中，业界涌现了大量相关工作，例如 …

2026年2月25日
359000
大模型评测

智谱GLM-4.7深度评测：Agentic Coding新标杆还是仍有短板？

智谱AI近期发布了其2025年中的旗舰模型GLM-4.7，该版本的核心定位是强化Agentic Coding能力。一句话总结：GLM-4.7在文本理解与创意写作方面表现突出，但在复杂代码生成与多模态理解上仍有明显不足，距离成为“Agentic Coding新标杆”尚需努力。核心评测结论：* 三大亮点： * 基础推理扎实：在数学计算、逻辑推理、文本处理等基…

2026年1月4日
1.5K000