软件工程
-
SWE-MiniSandbox:无需容器,低成本训练你的AI编程助手!北大团队开源轻量级SWE Agent训练框架
本工作由北京大学王选计算机研究所赵东岩、张辉帅老师团队完成,第一作者为北京大学前沿交叉学科研究院硕士生袁旦龙。 随着软件工程智能体(SWE Agent)因其明确的应用前景与价值而备受关注,从业者尝试训练自己的智能体时却面临挑战。当前主流训练方法依赖容器技术(如 Docker)实现环境隔离与复现,但其高昂的基础设施与运维成本,尤其在扩展训练规模时,构成了显著的…
-
FeatureBench:填补大模型端到端复杂功能开发评测空白,中科院自动化所与华为联合推出新基准
在 Princeton 发布 SWE-Bench 之后,利用真实世界代码仓库与可执行测试来评估大语言模型的软件工程能力,已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,催生了一系列 SWE 系列基准,在刻画模型修复缺陷的能力方面发挥了重要作用。 然而,真实的软件工程实践远不止于修复缺陷。大量关键工作发生在功能级别的端到端开发中:这通…
-
设计模式决策树:告别死记硬背,精准匹配代码痛点
围绕痛点选择设计模式:在任何面向对象语言中,以最小的过度设计匹配到合适的模式。 设计模式很少因为“错”而失败。更常见的是,我们在不合适的时机、出于不对的原因去套用它们,或者把它们当作替代品,回避给真实问题命名。通常,难点并不在于记住某个模式的存在,而在于判断你的代码此刻是否需要它,还是一个更简单的动作更合适。 这正是决策树有用的原因。它在你选择模式之前强制你…
-
UML之父怒怼AI淘汰论:软件工程迎来第三次黄金时代,AI只是更高层级的抽象
近日,关于“互联网已死”、“SaaS 已被 AI 扼杀”的论调,伴随着各类新奇的 Agentic 产品发布以及部分 AI 领域意见领袖“代码已不值钱”的言论,再次甚嚣尘上。 事实果真如此吗?答案显然是否定的。 多位知名的投资人及企业家迅速予以反驳。例如,a16z 的知名投资人 Jutine Moore 便在社交媒体上调侃“SaaS 已死”的论调过于天真: “…
-
跨越工程鸿沟:软件工程方法论指导下的企业级AI Agent构建实战
AI Agent 正在成为大模型发展的重要方向,也逐渐成为企业数字化转型中具备实用价值的突破口。与单一的大模型对话不同,Agent 不仅能够理解指令,还可以围绕目标进行任务规划、工具调用和流程执行,从而完成更复杂的业务闭环。然而,从“知道 Agent 是什么”到“在企业环境中稳定运行并产生价值”,中间仍然存在一道明显的工程鸿沟。 万变不离其宗,AI Agen…
-
Python进阶之路:避开6个常见陷阱,从中级迈向高级开发者
这已经不再是语法的问题。 如果到了 2026 年你还在学新的 Python 语法,你不是卡住了——你是在拖延。 刻薄吗?也许。 是真的吗?绝对。 大多数中级 Python 开发者不是因为不够懂 Python 而失败。 他们失败,是因为还在用新手的思维……只是写得更快。 过去 4 年多里,我审阅过上百个 Python 代码库——创业项目、内部工具、“在我机器上…
-
谷歌Cloud AI负责人14年经验:21条反直觉工程法则,从“规模让bug也有用户”到“创新需要偿还”
Addy Osmani 是谷歌 Cloud AI 的总监,专注于帮助开发者和企业通过 Gemini、Vertex AI 和代理开发套件(ADK)取得成功。他在谷歌拥有14年的工作经验,曾参与 DevTools、Lighthouse 和 Core Web Vitals 的开发,拥有 25 年构建网络技术的行业经验,同时也是《超越Vibe编程》《学习 JavaS…
-
硅谷工程文化真相:职业开发者如何掌控AI编程,而非盲目跟随Vibe Coding
Vibe Coding 再次被证明“被吹得有点过了”! 过去一年,自前 OpenAI 创始成员 Karpathy 引燃“Vibe Coding”概念后,整个 AI 编程赛道以十倍速热闹起来。LLM 厂商们以“肉眼都快分不清”的速度在编程能力上进行疯狂代际提升,智能编程也从最初的“超级自动补全”进化到了 Agentic 的自主编程时代。 如今,关于 Vibe …
-
AI取代不了程序员,明年全流程上AI!谷歌工程负责人自曝:2026年AI编程完整工作流!经典软件工程纪律没过时,在AI时代更重要
2025年,AI 编程助手真正成为了改变游戏规则的工具 不少开发者已经拥抱了AI编程工具,比如大家熟知的Claude Code、Codex CLI、Cursor、Gemini CLI等等。但要真正高效驾驭它们,还需要技巧和结构化的方法。 谷歌工程负责人分享AI编程工作流 谷歌工程负责人、Chrome DevTools 和 JS Patterns 的设计者 A…
-
解锁Agentic AI并行化:14个核心模式提升系统可靠性与性能
构建高效的智能体(Agentic)系统,离不开扎实的软件工程实践。其核心在于设计能够协调运作、并行执行,并能与外部系统高效交互的组件。例如,推测执行(Speculative Execution) 通过预先处理可预测的请求来降低延迟;冗余执行(Redundant Execution) 则通过同时运行同一智能体的多个副本来避免单点故障,提升系统韧性。除此之外,还…
