软件工程

  • Claude Opus 4.7突袭发布:性能全面升级,视觉能力提升3倍,高级软件工程表现亮眼

    Claude Opus 4.7 突袭发布:性能全面升级,视觉能力提升3倍,高级软件工程表现亮眼(上) Anthropic 在发布代号为“Mythos”的预览模型后,迅速推出了其公开可用的最强模型——Claude Opus 4.7。 此次更新在多个关键领域实现了显著提升,尤其在高级软件工程任务上表现突出,但部分用户反馈其风格与行为模式有所变化。 核心升级四大方…

    AI产业动态 2026年4月17日
    38700
  • 港大开源CLI-Anything:一条命令让任何软件变身AI Agent可操控工具,4天狂揽1.5万Star

    CLI-Anything:一条命令将软件源码转化为AI Agent可操控工具 香港大学团队近日开源了一个名为 CLI-Anything 的项目。该项目旨在通过一条命令,将任何拥有源代码的软件转化为AI Agent可以直接操控的命令行工具,无需手动编写API接口或配置浏览器自动化。 核心功能 其核心逻辑是构建一个全自动的七阶段流水线:1. 分析源码2. 设计命…

    2026年3月26日
    96500
  • SWE-MiniSandbox:无需容器,低成本训练你的AI编程助手!北大团队开源轻量级SWE Agent训练框架

    本工作由北京大学王选计算机研究所赵东岩、张辉帅老师团队完成,第一作者为北京大学前沿交叉学科研究院硕士生袁旦龙。 随着软件工程智能体(SWE Agent)因其明确的应用前景与价值而备受关注,从业者尝试训练自己的智能体时却面临挑战。当前主流训练方法依赖容器技术(如 Docker)实现环境隔离与复现,但其高昂的基础设施与运维成本,尤其在扩展训练规模时,构成了显著的…

    2026年3月22日
    53600
  • FeatureBench:填补大模型端到端复杂功能开发评测空白,中科院自动化所与华为联合推出新基准

    在 Princeton 发布 SWE-Bench 之后,利用真实世界代码仓库与可执行测试来评估大语言模型的软件工程能力,已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,催生了一系列 SWE 系列基准,在刻画模型修复缺陷的能力方面发挥了重要作用。 然而,真实的软件工程实践远不止于修复缺陷。大量关键工作发生在功能级别的端到端开发中:这通…

    2026年3月4日
    35100
  • 设计模式决策树:告别死记硬背,精准匹配代码痛点

    围绕痛点选择设计模式:在任何面向对象语言中,以最小的过度设计匹配到合适的模式。 设计模式很少因为“错”而失败。更常见的是,我们在不合适的时机、出于不对的原因去套用它们,或者把它们当作替代品,回避给真实问题命名。通常,难点并不在于记住某个模式的存在,而在于判断你的代码此刻是否需要它,还是一个更简单的动作更合适。 这正是决策树有用的原因。它在你选择模式之前强制你…

    2026年2月22日
    31100
  • UML之父怒怼AI淘汰论:软件工程迎来第三次黄金时代,AI只是更高层级的抽象

    近日,关于“互联网已死”、“SaaS 已被 AI 扼杀”的论调,伴随着各类新奇的 Agentic 产品发布以及部分 AI 领域意见领袖“代码已不值钱”的言论,再次甚嚣尘上。 事实果真如此吗?答案显然是否定的。 多位知名的投资人及企业家迅速予以反驳。例如,a16z 的知名投资人 Jutine Moore 便在社交媒体上调侃“SaaS 已死”的论调过于天真: “…

    2026年2月10日
    52300
  • 跨越工程鸿沟:软件工程方法论指导下的企业级AI Agent构建实战

    AI Agent 正在成为大模型发展的重要方向,也逐渐成为企业数字化转型中具备实用价值的突破口。与单一的大模型对话不同,Agent 不仅能够理解指令,还可以围绕目标进行任务规划、工具调用和流程执行,从而完成更复杂的业务闭环。然而,从“知道 Agent 是什么”到“在企业环境中稳定运行并产生价值”,中间仍然存在一道明显的工程鸿沟。 万变不离其宗,AI Agen…

    2026年2月9日
    35300
  • Python进阶之路:避开6个常见陷阱,从中级迈向高级开发者

    这已经不再是语法的问题。 如果到了 2026 年你还在学新的 Python 语法,你不是卡住了——你是在拖延。 刻薄吗?也许。 是真的吗?绝对。 大多数中级 Python 开发者不是因为不够懂 Python 而失败。 他们失败,是因为还在用新手的思维……只是写得更快。 过去 4 年多里,我审阅过上百个 Python 代码库——创业项目、内部工具、“在我机器上…

    2026年1月11日
    37100
  • 谷歌Cloud AI负责人14年经验:21条反直觉工程法则,从“规模让bug也有用户”到“创新需要偿还”

    Addy Osmani 是谷歌 Cloud AI 的总监,专注于帮助开发者和企业通过 Gemini、Vertex AI 和代理开发套件(ADK)取得成功。他在谷歌拥有14年的工作经验,曾参与 DevTools、Lighthouse 和 Core Web Vitals 的开发,拥有 25 年构建网络技术的行业经验,同时也是《超越Vibe编程》《学习 JavaS…

    2026年1月5日
    54500
  • 硅谷工程文化真相:职业开发者如何掌控AI编程,而非盲目跟随Vibe Coding

    Vibe Coding 再次被证明“被吹得有点过了”! 过去一年,自前 OpenAI 创始成员 Karpathy 引燃“Vibe Coding”概念后,整个 AI 编程赛道以十倍速热闹起来。LLM 厂商们以“肉眼都快分不清”的速度在编程能力上进行疯狂代际提升,智能编程也从最初的“超级自动补全”进化到了 Agentic 的自主编程时代。 如今,关于 Vibe …

    2025年12月31日
    38500