AI模型周报:通义千问、MiniMax、智谱AI等巨头齐发新版,图像编辑与编程能力全面升级

AI模型周报:通义千问、MiniMax、智谱AI等巨头齐发新版,图像编辑与编程能力全面升级

12月23日

【闭源】通义千问发布图像编辑模型快照
通义千问团队发布了 qwen-image-edit-plus-2025-12-15 图像编辑模型的最新快照。该版本在角色一致性、工业设计能力和几何推理能力上相较前代实现显著提升,优化了编辑后图片与原图在空间布局、纹理和风格上的匹配度,编辑效果更为精准细腻,旨在为专业图像处理提供更强大的工具支持。

【开源】MiniMax 开源 M2.1 模型
MiniMax 正式开源了 M2 模型的升级版 MiniMax-M2.1。该模型聚焦于提升真实世界复杂任务的实用性,重点优化了多语言编程与办公场景。核心亮点包括:
* 卓越的多语言编程能力
* 强化了 Web 与原生 App 开发能力,提升 Android/iOS 开发和设计美学表达。
* 复合指令理解能力升级,作为开源模型中率先引入 Interleaved Thinking 的系列。
* 提供更简洁高效的交互体验,回复与思维链更精炼,Token 消耗更低。
* 具备强大的 Agent 与工具泛化能力。

【开源】智谱AI发布并开源 GLM-4.7
智谱AI发布并开源了 GLM-4.7 模型,该版本面向 Coding 场景,强化了编码能力、长程任务规划与工具协同,在多项主流公开基准测试中取得开源模型领先表现。其在编程、推理与智能体三个维度实现突破,具备更强的编程能力,显著提升多语言编码和终端智能体效果,并支持 Claude Code、TRAE、Kilo Code、Cline 和 Roo Code 等框架的“先思考、再行动”机制。

12月24日

【开源】Qwen 发布图像编辑模型 2511 版本
Qwen 团队发布了 Qwen-Image-Edit-2511 版本。相比前代 Qwen-Image-Edit-2509,新版本在角色一致性、Lora 能力集成(支持打光、多场景)、工业设计及几何推理能力上实现多项增强,旨在为图像编辑应用提供更强大的技术底座。

【开源】阶跃星辰开源 NextStep-1.1 图像生成模型
阶跃星辰开源了 NextStep-1.1 图像生成模型。该版本有效解决了 NextStep-1 中的可视化失败问题,并通过扩展训练和基于 Flow 的强化学习(RL)后训练范式,大幅提升了图像生成质量。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/16325

(0)
上一篇 2025年12月29日 下午12:23
下一篇 2025年12月29日 下午12:27

相关推荐

  • 字节豆包AI全面升级:多模态Agent、图像视频生成大版本革新,引爆春节AI大战

    「2026 年或将成为人类历史上最忙碌、也最具决定性的一年。」xAI 联创 Jimmy Ba 在离职宣言中如是说。 这话并非夸张。1 月初,Anthropic 推出 Agent 工具 Claude Cowork,并发布 11 个配套插件;一周前,Anthropic 与 OpenAI 又几乎同时推出新版本基础大模型 Claude Opus 4.6 与 GPT-…

    2026年2月14日
    7200
  • 从LLM到多智能体系统:一份免费的AI技术学习地图与工程化指南

    如果你最近在关注 LLM、AI Agent、MCP、多智能体系统 ,那你大概率有过这种感觉: 信息太多,但没有一条清晰主线 视频、论文、课程一大堆,却不知道先学哪个 Demo 看懂了,但不知道怎么做成系统 这份文档旨在解决这些问题,它做了一件非常「工程化」的事: 把从 LLM → Agent → MCP → Multi-Agent 的完整学习路径,一次性整理…

    2026年2月9日
    9800
  • AI编程工具冲击开源商业模式:Tailwind CSS裁员75%背后的商业困境

    在生成式AI狂飙突进的2026年,如果你让一个AI编程智能体来编写网页应用,它很大概率会用到Tailwind CSS。这个CSS框架如今的周下载量已超过惊人的2600万次。 然而,这个备受AI智能体青睐的框架,其背后的团队却陷入了困境。 近日,Tailwind CSS创始人Adam Wathan在一条GitHub评论中揭示了一个辛酸的现实:团队已裁掉75%的…

    2026年1月10日
    24600
  • PhysX-Anything:单图生成仿真就绪3D资产,突破具身智能物理建模瓶颈

    在机器人、具身智能和交互仿真等前沿领域,对高质量、可直接用于物理仿真的3D资产需求日益迫切。传统3D生成方法多聚焦于几何外观与视觉保真度,却普遍忽视密度、绝对尺度、关节约束等关键物理属性,导致生成模型难以直接应用于真实世界的控制与交互任务。尽管已有少数研究探索可动3D对象生成,但受限于高质量物理标注数据的稀缺,现有方法多采用“检索现有模型+附加运动”的范式,…

    2025年11月23日
    16400
  • Dual-Flow:颠覆传统对抗攻击范式,实现多目标多模型黑盒攻击新突破

    在人工智能安全领域,对抗攻击一直是研究的热点与难点。近日,清华大学与蚂蚁数科联合在NeurIPS 2024会议上提出的Dual-Flow框架,为这一领域带来了革命性的突破。该框架通过创新的双流结构和训练机制,实现了对多种模型、多种类别的黑盒攻击,且无需依赖目标模型结构或梯度信息,为AI模型的安全性评估与防御体系构建提供了全新的视角与工具。 Dual-Flow…

    2025年12月15日
    19600