AI大模型周报:蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级

AI大模型周报:蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级

2月11日

【开源】 蚂蚁集团旗下团队 inclusionAI 发布 Ring-2.5-1T,这是 Ring-1T 的升级版本,核心特性可概括为“快、深、长”。其生成效率提升超过 3 倍,访存开销降低 10 倍;具备国际数学奥林匹克竞赛金牌级别的深度思考能力,并能连续工作 2 小时编写出迷你操作系统。该模型采用 MIT 协议完全开源。

模型详情:https://modelscope.cn/models/inclusionAI/Ring-2.5-1T

2月12日

【闭源】 OpenAI 发布 GPT-5.3-Codex-Spark,这是首个专为实时编程设计的超快模型,基于 Cerebras WSE-3 硬件进行了优化。其推理速度超过 1000 token/s,支持 128k 上下文长度,通过 WebSocket 大幅降低了延迟。在 SWE-Bench Pro 等测试中,该模型兼具极致速度与强劲逻辑推理能力,目前已向 ChatGPT Pro 用户开放预览。

官方介绍:https://openai.com/index/introducing-gpt-5-3-codex-spark/

【开源】 MiniMax 发布 MiniMax M2.5,延续了 MoE 架构的高并发优势,并显著增强了通用推理与长文本处理能力。该模型针对多轮对话与复杂逻辑场景进行了专项优化,旨在为企业级应用提供兼具高速度与高智能的高性价比解决方案。

官方介绍:https://minimaxi.com/news/minimax-m25

【开源】 智谱 AI 发布新一代预训练模型 GLM-5,在数理逻辑、代码编写及多模态理解能力上均有大幅提升。该模型支持超长上下文,在指令遵循与复杂任务规划方面表现优异,并深度适配了各类推理框架以降低部署门槛。

官方介绍:https://z.ai/blog/glm-5

【闭源】 字节跳动发布新一代视频创作模型 Seedance 2.0,采用统一多模态架构,支持图文音视混合输入。其生成质量达到当前最优水平,支持 15 秒长视频生成与双声道音频输出,显著提升了工业级创作的可控性与一致性。

官方介绍:https://seed.bytedance.com/seedance2_0

2月13日

【闭源】 字节跳动推出 Seedream 5.0 Lite 智能图像创作模型,引入了“深度思考”与实时搜索增强能力。通过统一多模态架构,该模型大幅提升了图文对齐的准确性与对物理规律的遵循度,能够理解模糊指令并结合时效性资讯进行创作。

官方介绍:https://seed.bytedance.com/en/seedream5_0_lite

2月14日

【闭源】 字节跳动发布豆包 Seed2.0 系列模型,包含 Pro、Lite、Mini 三款通用 Agent 模型以及一款专门的 Code 模型。该系列重点优化了视觉与多模态理解能力,对复杂文档、表格和视频内容的解析更加精准;同时大幅提升了执行多约束、长链路复杂指令的可靠性。

官方介绍:https://seed.bytedance.com/zh/blog?order_desc=true&offset=12

【开源】 小红书 FireRedTeam 发布 FireRed-Image-Edit-1.0,这是一款通用图像编辑模型。在多个主流基准测试中,其性能全面超越现有开源方案,甚至在部分维度上逼近了 Nano-Banana 等闭源商业模型。

模型详情:https://modelscope.cn/models/FireRedTeam/FireRed-Image-Edit-1.0


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21725

(0)
上一篇 2026年2月16日 下午12:10
下一篇 2026年2月16日 下午2:20

相关推荐

  • 英伟达财报揭示AI算力革命:从泡沫论到计算范式迁移的结构性分析

    英伟达最新季度财报的发布,不仅是一份财务数据的展示,更是对当前人工智能发展阶段的深刻注解。当市场对AI泡沫的担忧日益加剧时,英伟达以创纪录的570亿美元季度营收和66%的数据中心业务同比增长,给出了强有力的回应。这份成绩单背后,隐藏着计算产业正在经历的根本性变革——从通用CPU计算向加速GPU计算的范式迁移。 深入分析英伟达的财务表现,数据中心业务达到512…

    2025年11月20日
    21600
  • 突破PEFT合并瓶颈:方向鲁棒性理论揭示与RobustMerge方案解析

    在人工智能技术快速演进的浪潮中,多模态大模型已成为推动产业进步的核心引擎。然而,随着模型参数规模呈指数级增长,全量微调(Full Fine-Tuning, FFT)所需的海量计算资源已成为制约技术民主化的重要瓶颈。参数高效微调(Parameter-Efficient Fine-Tuning, PEFT)技术,特别是LoRA(Low-Rank Adaptati…

    2025年11月10日
    25700
  • 导演级AI重塑电影工业:Utopai East如何用叙事智能引擎撬动千亿韩流市场

    在传统好莱坞电影产业深陷高成本、低回报的结构性困境之际,一场由硅谷AI技术、韩国文化IP与中东资本共同驱动的产业革命正在悄然展开。AI原生影视工作室Utopai Studios与全球创新投资平台Stock Farm Road(SFR)近日宣布成立资本规模达数十亿美元的合资企业Utopai East,标志着AI影视生成技术正式从实验室走向产业化战场。这一战略合…

    2025年11月8日
    21700
  • 阿里云百炼引领智能体工业化革命:从手工作坊到AI流水线,企业级应用全面升级

    如果 AI 工具早一点出现,我们的很多工作会不会提前几年完成? 近日,整个科技圈都在感叹 AI 工具带来的效率提升。一些硅谷 AI 大厂工程师现身说法,表示在使用了 AI 工具后,项目完成时长被大幅压缩。 谷歌首席工程师、Gemini API 负责人 Jaana Dogan 分享了她使用智能体的经历。有的人甚至认为,如果在读博时就有 Claude Code、…

    2026年1月9日
    34800
  • Emu3.5:原生多模态世界模型的突破与全场景应用解析

    Emu3.5是由北京智源研究院最新发布的大规模多模态世界模型,其核心创新在于原生支持视觉与语言的联合状态预测。该模型采用统一的下一token预测目标进行端到端预训练,训练数据规模超过10万亿token,主要来源于互联网视频的连续帧及其转录文本,这为模型理解动态视觉序列与语言描述的关联性奠定了坚实基础。 模型架构设计上,Emu3.5天然接受交错的视觉-语言输入…

    2025年11月1日
    26800