AI模型周报:阶跃星辰GUI Agent破纪录,Mistral 3系列开源引领多模态浪潮

AI模型周报:阶跃星辰GUI Agent破纪录,Mistral 3系列开源引领多模态浪潮

12月1日

【开源】阶跃星辰开源GELab-Zero
阶跃星辰开源了GELab-Zero,首次将GUI Agent模型与完整的配套基础设施同步开放,支持一键部署。其4B参数的GUI Agent模型在手机端、电脑端等多个GUI基准测试中全面刷新了同尺寸模型的性能纪录,取得了SOTA成绩。此外,阶跃还开源了基于真实业务场景的自建评测标准AndroidDaily,旨在推动GUI领域模型评测向消费级、规模化应用发展。

模型链接:https://modelscope.cn/models/stepfun-ai/GELab-Zero-4B-preview

【开源】美团开源LongCat-Image系列
美团开源了LongCat-Image系列模型,包含一个基础生成模型、一个编辑模型及一个开发中间态模型,为开发者提供高效的双语图像生成与编辑能力。核心的LongCat-Image基础模型仅用6B参数,即在多项基准测试中取得领先,其关键优势在于卓越的中文文本渲染能力和出色的图像逼真度。LongCat-Image-Edit编辑模型支持基于中英文指令的精确图像修改,在实现开源SOTA性能的同时,能严格保持非编辑区域的视觉一致性。该系列配套开源了生产就绪的全栈训练代码,覆盖从数据整理、微调到对齐的完整流程。

模型链接:https://modelscope.cn/collections/LongCat-Image-17ef53fc3b4042

12月2日

【开源】Mistral AI发布Mistral 3系列
Mistral AI发布了新一代Mistral 3系列模型,全部采用Apache 2.0协议开源。旗舰模型Mistral Large 3采用MoE架构(激活参数41B/总参数675B),在开源非推理模型中排名第二,支持图像理解和多语言处理。同时推出的Ministral 3系列(3B/8B/14B)面向边缘场景,每个尺寸都有base、instruct、reasoning三个变体,其中14B reasoning版在AIME ’25测试中达到85%准确率。所有模型均支持多模态和40+种语言。

官方公告:https://mistral.ai/news/mistral-3

【开源】DeepSeek发布V3.2正式版
DeepSeek发布了两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2平衡了推理能力与输出长度,适合日常使用,在公开推理类Benchmark测试中达到GPT-5水平,略低于Gemini-3.0-Pro。DeepSeek-V3.2-Speciale是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力,性能表现媲美Gemini-3.0-Pro。

模型链接:https://modelscope.cn/collections/DeepSeek-V32-29d54eab6f3a4d

12月4日

【闭源】阿里发布通义千问系列模型更新
阿里发布了多款通义千问系列模型更新:
* qwen3-omni-flash-2025-12-01:通义千问Omni最新快照模型,支持的音色增加至49种,指令跟随能力大幅升级,能高效理解文本、图像、音频、视频。
* qwen-plus-2025-12-01:Qwen3 Plus系列的最新版本。
* qwen3-omni-flash-realtime-2025-12-01:通义千问Omni实时版最新快照模型,提供低延迟的多模态交互能力。
* qwen3-livetranslate-flash系列:音视频翻译模型,支持18种语言互译,可结合视觉上下文提升翻译准确性,并输出文本与语音。

详情请参见:https://help.aliyun.com/zh/model-studio/qwen-omni

12月5日

【闭源】腾讯混元发布HY 2.0模型
腾讯混元发布了最新版语言模型Tencent HY 2.0 Think和Tencent HY 2.0 Instruct。HY 2.0采用混合专家(MoE)架构,总参数406B,激活参数32B,支持256K上下文窗口。官方称其在推理能力与效率上居国内顶尖行列,在文本创作与复杂指令遵循等实用场景上表现突出。

官方文档:https://cloud.tencent.com/document/product/1729/104753


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/14569

(0)
上一篇 2025年12月8日 上午11:20
下一篇 2025年12月8日 下午1:04

相关推荐

  • 商汤医疗:以“医疗世界模型”重构智慧医院,半年融资10亿的AI医疗新范式

    在AI技术加速渗透医疗领域的当下,商汤医疗作为商汤集团“1+X”战略生态的核心延伸,在短短半年内累计融资规模已达10亿元,迅速跻身准独角兽行列。这一成绩不仅彰显了资本市场对AI医疗赛道的信心,更揭示了以“医疗世界模型”为核心的技术架构正在重塑智慧医院的未来图景。 商汤医疗的AI体系采用“通专融合”的技术路线,其核心是自研的医疗大语言模型“大医®”。这一模型在…

    2025年12月2日
    7800
  • 从技术突破到生态重塑:快手AI战略的产业级价值兑现路径分析

    2025年被广泛视为AI技术从实验室走向产业应用的关键转折点。在这一历史性节点上,以多模态生成、智能体(Agent)为代表的AI技术正加速探索更高效、更贴合实际需求的应用形态。其中最具战略意义的趋势在于:AI技术正在从单点创新迈向系统性、产业级价值的全面兑现。对于所有致力于数字化转型的企业而言,这不仅是一个技术命题,更是一个关乎未来竞争力的核心战略课题。 在…

    2025年11月3日
    7500
  • AI重塑跨境电商:1688“遨虾”如何用智能体重构B2B供应链三环节

    在AI技术从概念验证迈向产业落地的关键阶段,B2B领域正成为价值创造的前沿阵地。作为中国最大的B2B供应链平台,阿里巴巴旗下1688近期推出的跨境电商AI智能体“遨虾”(alphashop.cn),标志着AI正从辅助工具升级为核心生产力引擎。本文将从技术架构、产业影响和商业逻辑三个维度,深入分析这一变革如何重构跨境电商的选品、采购、上架全流程。 **一、技术…

    2025年12月7日
    16200
  • AI泡沫破裂后的科技人才迁徙:从行业震荡到创新扩散的深度剖析

    近期,《Nature》杂志发表的一篇深度文章引发了科技界的广泛关注,文章聚焦于一个核心问题:若当前的人工智能(AI)泡沫破裂,OpenAI、谷歌等头部AI公司的顶尖科学家将流向何方?这一议题不仅关乎科技人才的职业路径,更触及AI技术发展的底层逻辑与未来走向。本文将从经济规模、行业影响、人才流动趋势及创新扩散效应四个维度,对这一现象进行系统性分析。 首先,从经…

    2025年11月23日
    8100
  • ROVER:颠覆传统强化学习范式,随机策略价值评估开启LLM数学推理新纪元

    在人工智能领域,大语言模型(LLM)的数学推理能力一直是衡量其智能水平的重要标尺。近年来,基于可验证奖励的强化学习(RLVR)方法,如PPO、GRPO等,已成为提升模型推理能力的主流技术路径。然而,这些方法本质上仍沿袭传统强化学习的策略迭代框架——通过策略评估与策略改进的循环过程优化模型性能。这种范式在LLM推理任务中暴露出三大核心缺陷:训练稳定性差、计算复…

    2025年10月31日
    7100