AI模型周报:通义千问、MiniMax、智谱AI等巨头齐发新版,图像编辑与编程能力全面升级

AI模型周报:通义千问、MiniMax、智谱AI等巨头齐发新版,图像编辑与编程能力全面升级

12月23日

【闭源】通义千问发布图像编辑模型快照
通义千问团队发布了 qwen-image-edit-plus-2025-12-15 图像编辑模型的最新快照。该版本在角色一致性、工业设计能力和几何推理能力上相较前代实现显著提升,优化了编辑后图片与原图在空间布局、纹理和风格上的匹配度,编辑效果更为精准细腻,旨在为专业图像处理提供更强大的工具支持。

【开源】MiniMax 开源 M2.1 模型
MiniMax 正式开源了 M2 模型的升级版 MiniMax-M2.1。该模型聚焦于提升真实世界复杂任务的实用性,重点优化了多语言编程与办公场景。核心亮点包括:
* 卓越的多语言编程能力
* 强化了 Web 与原生 App 开发能力,提升 Android/iOS 开发和设计美学表达。
* 复合指令理解能力升级,作为开源模型中率先引入 Interleaved Thinking 的系列。
* 提供更简洁高效的交互体验,回复与思维链更精炼,Token 消耗更低。
* 具备强大的 Agent 与工具泛化能力。

【开源】智谱AI发布并开源 GLM-4.7
智谱AI发布并开源了 GLM-4.7 模型,该版本面向 Coding 场景,强化了编码能力、长程任务规划与工具协同,在多项主流公开基准测试中取得开源模型领先表现。其在编程、推理与智能体三个维度实现突破,具备更强的编程能力,显著提升多语言编码和终端智能体效果,并支持 Claude Code、TRAE、Kilo Code、Cline 和 Roo Code 等框架的“先思考、再行动”机制。

12月24日

【开源】Qwen 发布图像编辑模型 2511 版本
Qwen 团队发布了 Qwen-Image-Edit-2511 版本。相比前代 Qwen-Image-Edit-2509,新版本在角色一致性、Lora 能力集成(支持打光、多场景)、工业设计及几何推理能力上实现多项增强,旨在为图像编辑应用提供更强大的技术底座。

【开源】阶跃星辰开源 NextStep-1.1 图像生成模型
阶跃星辰开源了 NextStep-1.1 图像生成模型。该版本有效解决了 NextStep-1 中的可视化失败问题,并通过扩展训练和基于 Flow 的强化学习(RL)后训练范式,大幅提升了图像生成质量。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/16325

(0)
上一篇 2025年12月29日 下午12:23
下一篇 2025年12月29日 下午12:27

相关推荐

  • AI数学推理新突破:Harmonic模型独立证明Erdős问题简易版,开启数学证明新范式

    近日,数学与人工智能交叉领域迎来一项里程碑式进展——AI研究公司Harmonic开发的数学推理模型Aristotle,独立证明了困扰数学家近30年的Erdős问题#124的简易版本。这一突破不仅展示了AI在复杂数学推理方面的强大能力,更可能预示着数学研究范式的深刻变革。 **数学难题的AI解法** Erdős问题#124是一个典型的组合数论问题,其核心在于探…

    2025年12月1日
    45300
  • 360推出国内首个工业级AI漫剧智能体平台,实现90%成功率与1小时单集制作

    允中 发自 凹非寺 量子位 | 公众号 QbitAI 一个规模达200亿的市场,长期被“低效抽卡”的创作模式所困扰。 当前的AI漫剧行业,一面是年增速超过80%的蓬勃市场,另一面却是创作者为对齐一个分镜而通宵“炼丹”的艰辛。 360此次推出的解决方案,逻辑直接而高效:将剧本、资产生成到分镜合成的全流程整合进一条自动化流水线,将素材生成成功率一举提升至90%以…

    2026年1月30日
    41300
  • OpenAI大地震:三大王牌合并,总裁Brockman出山,9亿用户面临生死战

    就在刚刚,周六早上的科技圈再次传来重磅消息。 OpenAI官方毫无预警地宣布了公司历史上在IPO前夕规模最大、调整最剧烈的一次组织架构大重组。 ChatGPT、Codex以及开发者生态的命脉——API,这三大核心产品线被全部打散,原地合并为一个统一的产品组织! 更令人震惊的是,一度隐居幕后的OpenAI联合创始人兼总裁、那个曾因奥特曼被罢免而愤然辞职的技术战…

    22小时前
    8200
  • OpenAI推出工作区智能体:GPTs退休倒计时,AI助手开启7×24小时自动办公时代

    GPTs 即将退出舞台。 OpenAI 今日在 ChatGPT 中正式推出“工作区智能体”(workspace agents)。这是对 GPTs 的全面升级,由 Codex 驱动,在云端拥有独立的工作区,具备文件存储、代码运行、外部工具调用以及记忆能力。 关键在于,它能够持续运行,实现全天候自动化办公。 有评论将其比作 OpenAI 版的自动化工作流工具。 …

    2026年4月23日
    45500
  • Gemini Canvas与AI Studio深度解析:从零门槛3D交互到开发者核武库的技术革命

    在人工智能技术快速迭代的今天,谷歌的Gemini系列模型正以前所未有的方式重塑内容创作与开发的边界。近期,一个名为el.cine的演示引发了广泛关注:仅通过简单的自然语言提示词,即可生成实时交互的3D粒子系统,用户通过摄像头检测双手张合手势直接控制粒子群的缩放与扩散。这一成果不仅震惊了有经验的程序员(他们曾需花费数周学习GLSL着色器),更标志着复杂3D交互…

    2025年12月7日
    47100