代码生成
-
AI大模型周报:阿里Qwen3.5 Plus多模态突破、谷歌Gemini 3.1 Pro推理升级、蚂蚁Ling-2.5即时模型开源
2月16日 【开源】阿里推出最新模型 Qwen3.5 Plus,支持文本、图像和视频多模态输入。 该模型在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面(GUI)等多种任务中表现卓越,并支持内置工具调用。详情请参见:https://help.aliyun.com/zh/model-studio/text-generation 【开…
-
AI大模型周报:蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级
2月11日 【开源】 蚂蚁集团旗下团队 inclusionAI 发布 Ring-2.5-1T,这是 Ring-1T 的升级版本,核心特性可概括为“快、深、长”。其生成效率提升超过 3 倍,访存开销降低 10 倍;具备国际数学奥林匹克竞赛金牌级别的深度思考能力,并能连续工作 2 小时编写出迷你操作系统。该模型采用 MIT 协议完全开源。 模型详情:https:…
-
豆包大模型2.0重磅发布:21个月磨一剑,多模态理解与推理能力全面升级
在 Seedance 2.0 和 Seedream 5.0 Lite 接连引发热潮之后,豆包推出了其核心的完全体——豆包大模型2.0。 这是时隔21个月的最大版本更新。 以 Seedance 2.0 为例,它已成为全民体验的AI应用。我们尝试制作了一段视频: 短短5秒,生成效果已足够逼真。 这也难怪海外用户开始研究如何注册中国手机号来体验了。 再如 Seed…
-
AI编程革命:从手工艺到工业化的软件未来
工业软件的崛起 Industrial adj. (sense 3a) 与生产性工作、贸易或制造相关的,尤指机械工业或大规模制造;(也指)由此类工业产生的。 —《牛津英语词典》 在软件发展史的大部分时间里,软件更像是手工艺品而非工业制品:成本高昂、开发缓慢,严重依赖技能和经验。AI 编程正在改变这一切,它提供了更便宜、更快速的生产路径,越来越不依赖人类的专业知…
-
智谱GLM-4.7深度评测:Agentic Coding新标杆还是仍有短板?
智谱AI近期发布了其2025年中的旗舰模型GLM-4.7,该版本的核心定位是强化Agentic Coding能力。 一句话总结:GLM-4.7在文本理解与创意写作方面表现突出,但在复杂代码生成与多模态理解上仍有明显不足,距离成为“Agentic Coding新标杆”尚需努力。 核心评测结论:* 三大亮点: * 基础推理扎实:在数学计算、逻辑推理、文本处理等基…
-
TRAE年度报告揭秘:AI IDE如何重塑编程范式,从Coder到Commander的进化之路
TRAE年度报告揭秘:AI IDE如何重塑编程范式 2025年末,TRAE 正式发布了其年度产品报告。 报告开篇便展示了一组引人注目的数据: TRAE在一年里生成了1000亿行代码! 这个数字意味着什么? 若以一名程序员日均编写100行有效代码计算,这相当于300万名程序员全年无休的工作成果。 而这仅仅是《TRAE 2025年度产品报告》的冰山一角。报告还揭…
-
Claude Code之父自曝生产数据:30天259个PR全由AI编写,代码不再是瓶颈
编辑|听雨 Claude Code 创始人 Boris Cherny 近期在社交平台 X 上公布了过去一个月使用 Claude Code 的真实生产数据,其规模令人惊讶: 在过去 30 天里,我合并了 259 个 PR —— 共 497 次提交,新增约 4 万行代码,删除约 3.8 万行代码。而且,每一行代码都是由 Claude Code + Opus 4.…
-
MiniMax M2.1深度实测:全栈开发新利器,从人生K线图到iOS木鱼App的代码生成实战
国产 AI 大模型 MiniMax M2.1 正式发布。 本次更新在 Multi-SWE(多软件工程)领域实现了显著升级。它不仅让 Web 开发、App 开发以及 Rust、Go、Java 等核心技术栈的开发体验更为流畅,其全栈能力也得到了大幅增强。 一个突出的亮点在于其能力的均衡性。 此前许多 AI 模型,包括近期备受关注的 Gemini 3 Pro,往往…
-
AI取代不了程序员,明年全流程上AI!谷歌工程负责人自曝:2026年AI编程完整工作流!经典软件工程纪律没过时,在AI时代更重要
2025年,AI 编程助手真正成为了改变游戏规则的工具 不少开发者已经拥抱了AI编程工具,比如大家熟知的Claude Code、Codex CLI、Cursor、Gemini CLI等等。但要真正高效驾驭它们,还需要技巧和结构化的方法。 谷歌工程负责人分享AI编程工作流 谷歌工程负责人、Chrome DevTools 和 JS Patterns 的设计者 A…
-
腾讯混元HY 2.0 Think深度评测:思考能力初显,但前端实现仍欠火候
混元大模型近期推出了HY 2.0 Think版本,其核心特性是深度思考能力。我们使用一套前端评测用例,对其代码生成能力进行了测试。 常规用例评测 这部分用例与之前的DeepSeek V3.2评测保持一致,旨在快速评估其整体水平。 (1) 复古打印机 核心功能完整实现,打字效果富有节奏感。卡片拖拽功能正常,页面风格也体现了复古韵味。 (2) 双栏响应式Hero…
