AI模型周报:通义千问、MiniMax、智谱AI等巨头齐发新版,图像编辑与编程能力全面升级

AI模型周报:通义千问、MiniMax、智谱AI等巨头齐发新版,图像编辑与编程能力全面升级

12月23日

【闭源】通义千问发布图像编辑模型快照
通义千问团队发布了 qwen-image-edit-plus-2025-12-15 图像编辑模型的最新快照。该版本在角色一致性、工业设计能力和几何推理能力上相较前代实现显著提升,优化了编辑后图片与原图在空间布局、纹理和风格上的匹配度,编辑效果更为精准细腻,旨在为专业图像处理提供更强大的工具支持。

【开源】MiniMax 开源 M2.1 模型
MiniMax 正式开源了 M2 模型的升级版 MiniMax-M2.1。该模型聚焦于提升真实世界复杂任务的实用性,重点优化了多语言编程与办公场景。核心亮点包括:
* 卓越的多语言编程能力
* 强化了 Web 与原生 App 开发能力,提升 Android/iOS 开发和设计美学表达。
* 复合指令理解能力升级,作为开源模型中率先引入 Interleaved Thinking 的系列。
* 提供更简洁高效的交互体验,回复与思维链更精炼,Token 消耗更低。
* 具备强大的 Agent 与工具泛化能力。

【开源】智谱AI发布并开源 GLM-4.7
智谱AI发布并开源了 GLM-4.7 模型,该版本面向 Coding 场景,强化了编码能力、长程任务规划与工具协同,在多项主流公开基准测试中取得开源模型领先表现。其在编程、推理与智能体三个维度实现突破,具备更强的编程能力,显著提升多语言编码和终端智能体效果,并支持 Claude Code、TRAE、Kilo Code、Cline 和 Roo Code 等框架的“先思考、再行动”机制。

12月24日

【开源】Qwen 发布图像编辑模型 2511 版本
Qwen 团队发布了 Qwen-Image-Edit-2511 版本。相比前代 Qwen-Image-Edit-2509,新版本在角色一致性、Lora 能力集成(支持打光、多场景)、工业设计及几何推理能力上实现多项增强,旨在为图像编辑应用提供更强大的技术底座。

【开源】阶跃星辰开源 NextStep-1.1 图像生成模型
阶跃星辰开源了 NextStep-1.1 图像生成模型。该版本有效解决了 NextStep-1 中的可视化失败问题,并通过扩展训练和基于 Flow 的强化学习(RL)后训练范式,大幅提升了图像生成质量。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/16325

(0)
上一篇 2025年12月29日 下午12:23
下一篇 2025年12月29日 下午12:27

相关推荐

  • GPT-5.2深度解析:专业AI如何重塑知识工作范式

    在人工智能技术快速迭代的浪潮中,OpenAI于近期正式发布了GPT-5.2系列模型,标志着通用人工智能在专业领域的应用迈入了新的阶段。本次更新并非简单的性能提升,而是针对高复杂度知识型工作场景的系统性优化,其技术架构与能力边界值得深入探讨。 GPT-5.2系列包含三个针对性版本:GPT‑5.2 Instant(即时版)注重响应速度与轻量级任务处理;GPT‑5…

    2025年12月12日
    8200
  • 嵌套学习与记忆熊:AI记忆革命如何重塑大模型进化路径

    近期,Google Research发表的《Nested Learning: The Illusion of Deep Learning Architectures》论文在业界引发广泛关注,被普遍视为2017年《Attention is All You Need》的“精神续作”。这篇论文之所以获得如此高的评价,关键在于它提出了一种全新的机器学习范式——嵌套学…

    2025年12月3日
    8900
  • 数学圣殿数字化:IHES Library如何重塑全球数学教育生态

    在人工智能浪潮席卷全球的当下,数学作为基础科学的基石地位愈发凸显。近日,茶思屋科技上线的IHES Library项目,将法国高等科学研究所(Institut des Hautes Études Scientifiques)这座数学圣殿的2369个学术视频资源数字化开放,标志着顶尖数学教育资源普惠化迈出了关键一步。这一举措不仅是对传统学术传播模式的革新,更可能…

    2025年11月12日
    8500
  • 突破文本桎梏:C2C通信范式如何重塑多智能体协作效率

    随着大语言模型在代码生成、数学推理、视觉理解及边缘计算等垂直领域的深度渗透,多智能体系统正成为处理复杂场景任务的关键架构。传统基于文本对话(Text-to-Text,T2T)的协作模式,虽在基础任务中表现尚可,却在面对高维语义传递时暴露出根本性缺陷:信息在文本压缩过程中大量流失、自然语言固有的模糊性导致指令歧义、以及逐token生成机制引发的通信延迟。这些瓶…

    2025年10月29日
    7600
  • 效率革命:微博VibeThinker以15亿参数重塑大模型竞争格局

    在AI行业普遍陷入“参数崇拜”的背景下,微博AI近期发布的VibeThinker开源大模型,以仅15亿参数的轻量级架构,在国际顶级数学竞赛基准测试中击败了参数量高达6710亿的DeepSeek R1模型,这一突破性成果不仅挑战了传统技术评价标准,更可能引发AI产业从“规模竞赛”向“效率革命”的深刻转型。 ### 技术范式突破:小模型如何实现复杂推理能力 长期…

    2025年11月18日
    8000