AI模型周报:阶跃星辰GUI Agent破纪录,Mistral 3系列开源引领多模态浪潮

AI模型周报:阶跃星辰GUI Agent破纪录,Mistral 3系列开源引领多模态浪潮

12月1日

【开源】阶跃星辰开源GELab-Zero
阶跃星辰开源了GELab-Zero,首次将GUI Agent模型与完整的配套基础设施同步开放,支持一键部署。其4B参数的GUI Agent模型在手机端、电脑端等多个GUI基准测试中全面刷新了同尺寸模型的性能纪录,取得了SOTA成绩。此外,阶跃还开源了基于真实业务场景的自建评测标准AndroidDaily,旨在推动GUI领域模型评测向消费级、规模化应用发展。

模型链接:https://modelscope.cn/models/stepfun-ai/GELab-Zero-4B-preview

【开源】美团开源LongCat-Image系列
美团开源了LongCat-Image系列模型,包含一个基础生成模型、一个编辑模型及一个开发中间态模型,为开发者提供高效的双语图像生成与编辑能力。核心的LongCat-Image基础模型仅用6B参数,即在多项基准测试中取得领先,其关键优势在于卓越的中文文本渲染能力和出色的图像逼真度。LongCat-Image-Edit编辑模型支持基于中英文指令的精确图像修改,在实现开源SOTA性能的同时,能严格保持非编辑区域的视觉一致性。该系列配套开源了生产就绪的全栈训练代码,覆盖从数据整理、微调到对齐的完整流程。

模型链接:https://modelscope.cn/collections/LongCat-Image-17ef53fc3b4042

12月2日

【开源】Mistral AI发布Mistral 3系列
Mistral AI发布了新一代Mistral 3系列模型,全部采用Apache 2.0协议开源。旗舰模型Mistral Large 3采用MoE架构(激活参数41B/总参数675B),在开源非推理模型中排名第二,支持图像理解和多语言处理。同时推出的Ministral 3系列(3B/8B/14B)面向边缘场景,每个尺寸都有base、instruct、reasoning三个变体,其中14B reasoning版在AIME ’25测试中达到85%准确率。所有模型均支持多模态和40+种语言。

官方公告:https://mistral.ai/news/mistral-3

【开源】DeepSeek发布V3.2正式版
DeepSeek发布了两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2平衡了推理能力与输出长度,适合日常使用,在公开推理类Benchmark测试中达到GPT-5水平,略低于Gemini-3.0-Pro。DeepSeek-V3.2-Speciale是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力,性能表现媲美Gemini-3.0-Pro。

模型链接:https://modelscope.cn/collections/DeepSeek-V32-29d54eab6f3a4d

12月4日

【闭源】阿里发布通义千问系列模型更新
阿里发布了多款通义千问系列模型更新:
* qwen3-omni-flash-2025-12-01:通义千问Omni最新快照模型,支持的音色增加至49种,指令跟随能力大幅升级,能高效理解文本、图像、音频、视频。
* qwen-plus-2025-12-01:Qwen3 Plus系列的最新版本。
* qwen3-omni-flash-realtime-2025-12-01:通义千问Omni实时版最新快照模型,提供低延迟的多模态交互能力。
* qwen3-livetranslate-flash系列:音视频翻译模型,支持18种语言互译,可结合视觉上下文提升翻译准确性,并输出文本与语音。

详情请参见:https://help.aliyun.com/zh/model-studio/qwen-omni

12月5日

【闭源】腾讯混元发布HY 2.0模型
腾讯混元发布了最新版语言模型Tencent HY 2.0 Think和Tencent HY 2.0 Instruct。HY 2.0采用混合专家(MoE)架构,总参数406B,激活参数32B,支持256K上下文窗口。官方称其在推理能力与效率上居国内顶尖行列,在文本创作与复杂指令遵循等实用场景上表现突出。

官方文档:https://cloud.tencent.com/document/product/1729/104753


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/14569

(0)
上一篇 2025年12月8日 上午11:20
下一篇 2025年12月8日 下午1:04

相关推荐

  • 具身智能Scaling Law新突破:银河通用LDA-1B统一异构数据,3万小时训练超越GR00T

    近期,具身智能领域竞争激烈,堪称“神仙打架”。 先是 Generalist AI 发布了 GEN-1,凭借极高的数据效率和闭环控制能力刷新了多项操作纪录,引发行业震动。 两周后,具身赛道的另一位重量级玩家 Physical Intelligence 也推出了新模型 π 0.7,主打“组合与泛化”,对 VLA 架构进行了进一步升级。 尽管两者的技术哲学截然不同…

    2026年4月29日
    52200
  • AI周报:智谱GLM-4.6V革新视觉Agent,谷歌Gemini 2.5与OpenAI GPT-5.2齐发,多模态与智能体技术迎来爆发期

    12月8日 【开源】 智谱AI发布GLM-4.6V系列多模态大模型,包含GLM-4.6V(106B)云端版和GLM-4.6V-Flash(9B)轻量版。该系列模型支持128k超长上下文,在同参数规模下实现了视觉理解SOTA性能。其最大亮点在于首次将Function Call能力原生融入视觉模型架构,打通了从“视觉感知”到“可执行行动”的完整链路,为多模态Ag…

    2025年12月15日
    47000
  • DeepSeek拟以100亿美元估值融资3亿美元,AI独角兽首度寻求外部投资

    本周五,AI领域传出重要动态。 据The Information、路透社等媒体援引知情人士消息,中国人工智能初创公司DeepSeek正与投资者洽谈,计划以约100亿美元的估值筹集至少3亿美元资金。据悉,DeepSeek确实在与部分机构接触,但具体融资金额与估值等信息仍有待进一步核实。 DeepSeek脱胎于国内顶尖量化对冲基金幻方量化,其早期庞大的算力储备与…

    2026年4月18日
    38500
  • 豆包APP悄然启动付费订阅,AI助手商业化迎来新阶段

    豆包APP悄然启动付费订阅,AI助手商业化迎来新阶段 五一假期即将结束之际,一向低调的豆包突然搞了个大动作,直接冲上热搜: 这款名副其实的国民级AI助手,开始收费了。 在苹果App Store中,订阅服务声明已经悄然上线。除了免费的基础版外,订阅服务分为三个档次: 标准版:连续包月每月68元,连续包年每年688元; 加强版:连续包月每月200元,连续包年每年…

    2026年5月5日
    40100
  • Claude Task Viewer:实时可视化Claude Code任务执行过程的智能看板

    当Claude Code将复杂工作拆分为多个任务时,其思考过程在终端中往往显得零散。现在,一个工具将这些碎片拼接成了一幅完整的画面。 Claude Task Viewer 会在本地 3456 端口启动一个实时看板,并自动扫描 ~/.claude/tasks/ 目录下的所有会话。每个任务卡片会清晰展示当前状态、依赖关系,甚至 Claude 正在执行的具体操作。…

    2026年2月19日
    83200