AI大模型周报:蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级

AI大模型周报:蚂蚁Ring-2.5-1T开源、OpenAI发布GPT-5.3-Codex-Spark、字节跳动多模态模型全面升级

2月11日

【开源】 蚂蚁集团旗下团队 inclusionAI 发布 Ring-2.5-1T,这是 Ring-1T 的升级版本,核心特性可概括为“快、深、长”。其生成效率提升超过 3 倍,访存开销降低 10 倍;具备国际数学奥林匹克竞赛金牌级别的深度思考能力,并能连续工作 2 小时编写出迷你操作系统。该模型采用 MIT 协议完全开源。

模型详情:https://modelscope.cn/models/inclusionAI/Ring-2.5-1T

2月12日

【闭源】 OpenAI 发布 GPT-5.3-Codex-Spark,这是首个专为实时编程设计的超快模型,基于 Cerebras WSE-3 硬件进行了优化。其推理速度超过 1000 token/s,支持 128k 上下文长度,通过 WebSocket 大幅降低了延迟。在 SWE-Bench Pro 等测试中,该模型兼具极致速度与强劲逻辑推理能力,目前已向 ChatGPT Pro 用户开放预览。

官方介绍:https://openai.com/index/introducing-gpt-5-3-codex-spark/

【开源】 MiniMax 发布 MiniMax M2.5,延续了 MoE 架构的高并发优势,并显著增强了通用推理与长文本处理能力。该模型针对多轮对话与复杂逻辑场景进行了专项优化,旨在为企业级应用提供兼具高速度与高智能的高性价比解决方案。

官方介绍:https://minimaxi.com/news/minimax-m25

【开源】 智谱 AI 发布新一代预训练模型 GLM-5,在数理逻辑、代码编写及多模态理解能力上均有大幅提升。该模型支持超长上下文,在指令遵循与复杂任务规划方面表现优异,并深度适配了各类推理框架以降低部署门槛。

官方介绍:https://z.ai/blog/glm-5

【闭源】 字节跳动发布新一代视频创作模型 Seedance 2.0,采用统一多模态架构,支持图文音视混合输入。其生成质量达到当前最优水平,支持 15 秒长视频生成与双声道音频输出,显著提升了工业级创作的可控性与一致性。

官方介绍:https://seed.bytedance.com/seedance2_0

2月13日

【闭源】 字节跳动推出 Seedream 5.0 Lite 智能图像创作模型,引入了“深度思考”与实时搜索增强能力。通过统一多模态架构,该模型大幅提升了图文对齐的准确性与对物理规律的遵循度,能够理解模糊指令并结合时效性资讯进行创作。

官方介绍:https://seed.bytedance.com/en/seedream5_0_lite

2月14日

【闭源】 字节跳动发布豆包 Seed2.0 系列模型,包含 Pro、Lite、Mini 三款通用 Agent 模型以及一款专门的 Code 模型。该系列重点优化了视觉与多模态理解能力,对复杂文档、表格和视频内容的解析更加精准;同时大幅提升了执行多约束、长链路复杂指令的可靠性。

官方介绍:https://seed.bytedance.com/zh/blog?order_desc=true&offset=12

【开源】 小红书 FireRedTeam 发布 FireRed-Image-Edit-1.0,这是一款通用图像编辑模型。在多个主流基准测试中,其性能全面超越现有开源方案,甚至在部分维度上逼近了 Nano-Banana 等闭源商业模型。

模型详情:https://modelscope.cn/models/FireRedTeam/FireRed-Image-Edit-1.0


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21725

(0)
上一篇 3天前
下一篇 2天前

相关推荐

  • Sora核心团队重组:00后天才Will Depue领衔OpenAI超级人工智能新赌注

    在人工智能领域,每一次核心团队的重组都可能预示着技术路线的重大转向。近日,OpenAI内部传来重磅消息:曾主导Sora开发的00后天才工程师Will Depue结束长期休假,宣布重返公司,并与Troy Luhman、Eric Luhman两位年轻工程师组成三人特别小组,专注于一项被内部称为“极高风险赌注”的新项目。这个项目的最终目标直指超级人工智能(ASI)…

    2025年10月31日
    12200
  • 亚马逊云科技re:Invent 2025:AI算力帝国与开放模型生态的双重进化

    在拉斯维加斯举行的re:Invent 2025大会上,亚马逊云科技CEO Matt Garman以惊人的效率展示了公司在AI基础设施领域的全面布局。这场发布会的核心价值不仅体现在数量惊人的新品发布,更在于其系统性地构建了从底层算力到上层应用的完整AI技术栈。本文将从算力架构革新、模型生态战略、产业应用落地三个维度,深入剖析亚马逊云科技如何重新定义企业AI部署…

    2025年12月3日
    11100
  • AI视频生成技术深度解析:从萌宠治愈到Sora2留存困境的技术演进与市场挑战

    近期,社交媒体上涌现出大量展现儿童与宠物温馨互动的短视频,这些内容以其纯粹的情感表达和高度真实的画面质感迅速引发广泛关注。然而,仔细观察后不难发现,这些视频实际上是由AI视频生成技术制作的产物。本文将从技术原理、模型对比、市场表现等多个维度,对这一现象进行深入分析。 从技术层面来看,当前主流的AI视频生成模型如Sora2、Veo3.1以及可灵Video 2.…

    2025年12月7日
    14100
  • 从通用到专业:Libcom工作台如何重塑图像合成领域的精准编辑范式

    在2025年AIGC技术持续爆发的浪潮中,图像生成与编辑已成为数字内容创作的核心驱动力。从社交媒体的个性化头像到电商平台的动态海报,再到影视行业的预可视化分镜,AI生成内容正以前所未有的速度渗透至日常创作的各个环节。以Nano Banana、Qwen Edit为代表的通用图像编辑大模型凭借其强大的泛化能力,覆盖了从基础修图到复杂场景构建的广泛需求。特别是Na…

    2025年11月25日
    11500
  • vLLM集成PaddleOCR-VL:轻量化文档解析模型的高效推理新范式

    在人工智能技术快速迭代的浪潮中,模型部署与推理效率已成为制约实际应用落地的关键瓶颈。近日,vLLM项目宣布正式支持PaddleOCR-VL模型,这一举措不仅为文档解析领域带来了新的技术解决方案,更在模型服务化部署层面树立了轻量化与高效化并重的典范。本文将从技术架构、性能优化、部署实践及行业影响四个维度,深入剖析此次集成的核心价值与未来展望。 从技术架构层面看…

    2025年11月5日
    21700