
12月1日
【开源】阶跃星辰开源GELab-Zero
阶跃星辰开源了GELab-Zero,首次将GUI Agent模型与完整的配套基础设施同步开放,支持一键部署。其4B参数的GUI Agent模型在手机端、电脑端等多个GUI基准测试中全面刷新了同尺寸模型的性能纪录,取得了SOTA成绩。此外,阶跃还开源了基于真实业务场景的自建评测标准AndroidDaily,旨在推动GUI领域模型评测向消费级、规模化应用发展。
模型链接:https://modelscope.cn/models/stepfun-ai/GELab-Zero-4B-preview
【开源】美团开源LongCat-Image系列
美团开源了LongCat-Image系列模型,包含一个基础生成模型、一个编辑模型及一个开发中间态模型,为开发者提供高效的双语图像生成与编辑能力。核心的LongCat-Image基础模型仅用6B参数,即在多项基准测试中取得领先,其关键优势在于卓越的中文文本渲染能力和出色的图像逼真度。LongCat-Image-Edit编辑模型支持基于中英文指令的精确图像修改,在实现开源SOTA性能的同时,能严格保持非编辑区域的视觉一致性。该系列配套开源了生产就绪的全栈训练代码,覆盖从数据整理、微调到对齐的完整流程。
模型链接:https://modelscope.cn/collections/LongCat-Image-17ef53fc3b4042
12月2日
【开源】Mistral AI发布Mistral 3系列
Mistral AI发布了新一代Mistral 3系列模型,全部采用Apache 2.0协议开源。旗舰模型Mistral Large 3采用MoE架构(激活参数41B/总参数675B),在开源非推理模型中排名第二,支持图像理解和多语言处理。同时推出的Ministral 3系列(3B/8B/14B)面向边缘场景,每个尺寸都有base、instruct、reasoning三个变体,其中14B reasoning版在AIME ’25测试中达到85%准确率。所有模型均支持多模态和40+种语言。
官方公告:https://mistral.ai/news/mistral-3
【开源】DeepSeek发布V3.2正式版
DeepSeek发布了两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2平衡了推理能力与输出长度,适合日常使用,在公开推理类Benchmark测试中达到GPT-5水平,略低于Gemini-3.0-Pro。DeepSeek-V3.2-Speciale是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力,性能表现媲美Gemini-3.0-Pro。
模型链接:https://modelscope.cn/collections/DeepSeek-V32-29d54eab6f3a4d
12月4日
【闭源】阿里发布通义千问系列模型更新
阿里发布了多款通义千问系列模型更新:
* qwen3-omni-flash-2025-12-01:通义千问Omni最新快照模型,支持的音色增加至49种,指令跟随能力大幅升级,能高效理解文本、图像、音频、视频。
* qwen-plus-2025-12-01:Qwen3 Plus系列的最新版本。
* qwen3-omni-flash-realtime-2025-12-01:通义千问Omni实时版最新快照模型,提供低延迟的多模态交互能力。
* qwen3-livetranslate-flash系列:音视频翻译模型,支持18种语言互译,可结合视觉上下文提升翻译准确性,并输出文本与语音。
详情请参见:https://help.aliyun.com/zh/model-studio/qwen-omni
12月5日
【闭源】腾讯混元发布HY 2.0模型
腾讯混元发布了最新版语言模型Tencent HY 2.0 Think和Tencent HY 2.0 Instruct。HY 2.0采用混合专家(MoE)架构,总参数406B,激活参数32B,支持256K上下文窗口。官方称其在推理能力与效率上居国内顶尖行列,在文本创作与复杂指令遵循等实用场景上表现突出。
官方文档:https://cloud.tencent.com/document/product/1729/104753
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/14569
