【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

Claude 4.5与Gemini 3即将发布,但焦点在DeepSeek。其V3.2版本疑似官方预热,而十月将至的V4版本则被曝将实现1M上下文长度、GRPO Turbo多步思考及更高推理效率等重大升级。

最近科技圈可一点都没闲着,各家都在密谋放大招。先是传了很久的 Claude 4.5 预计未来一两周内亮相,Google 的 Gemini 3 也瞄准了咱们国庆档期。不过今天我们要重点聊的,是 DeepSeek 家的两条新动态——V4 和 V3.2。

关于 DeepSeek-V3.2 的最新线索
有开发者发现,DeepSeek 团队在 HuggingFace 上悄悄创建了名为 “DeepSeek-V3.2-Base” 的模型卡。有意思的是,这个页面在一个下午内反复出现又消失了好几次,这种“欲盖弥彰”的操作反而坐实了新版本的存在。

【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

比起网上流传的各种猜测,这条来自官方渠道的线索显然更值得关注。不少人猜测,这可能是为接下来的 V4 版本做预热——是不是颇有 OpenAI 的营销风格?

【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

DeepSeek-V4:性能大幅跃升
根据社区爆料,DeepSeek V4 计划在10月发布,而且这次不只是版本号升级那么简单。据传它将带来三大突破:

  • 上下文窗口扩展至 1M Tokens
  • 支持 GRPO Turbo 多步思考模式
  • 推理速度更快,成本更低

后两点尤其可信。回顾2023年以来,Qwen 和 DeepSeek 的技术路线就有着诸多相似之处。比如 GRPO 算法年初随 DeepSeekMath 发布后,年中的 Qwen2-Math 就展示了相似的技术特征。虽然当时 GRPO 尚未开源,但技术思路的同步确实引人遐想。

【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

技术前瞻:长文本处理将迎新突破
值得一提的是,Qwen 最近发布的 Qwen3-Next 采用了原生稀疏注意力(NSA)技术。该技术通过选择性计算关键词关系,有效解决了长序列处理中的计算瓶颈。这也让 DeepSeek V4 实现 1M 上下文窗口的传闻显得更加合理——毕竟两家在长文本技术上的进展一直相辅相成。

最后确认个好消息:这些新模型都会开源!

以上就是本期全部爆料。哪个模型最让你期待?欢迎在评论区分享你的看法~

参考资料:
[1] https://x.com/deepsseek/status/1972426156222611688

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/4118

(1)
上一篇 2025年9月29日 下午5:37
下一篇 2025年10月1日 下午5:15

相关推荐

  • AI浏览器革命:从工具到智能中枢的范式转移

    随着互联网进入AI时代,浏览器作为数字世界的核心入口,正经历着从被动工具到主动智能中枢的深刻变革。Market.us数据显示,全球AI浏览器市场规模预计从2024年的45亿美元增长至2034年的768亿美元,年复合增长率高达32.8%。这一数据背后,反映的不仅是市场规模的扩张,更是浏览器功能定位的根本性重构。 当前全球浏览器市场呈现出明显的“新旧秩序”更替特…

    2025年12月1日
    11500
  • 4KAgent:多智能体协同的通用图像超分辨率框架,突破传统模型局限

    图像超分辨率技术作为计算机视觉领域的重要研究方向,长期以来面临着处理复杂退化图像和跨领域应用的挑战。传统方法通常在特定数据集上表现优异,但面对真实世界中的噪声、模糊、压缩损伤以及AI生成图像、遥感影像、生物医学图像等多样化场景时,往往难以兼顾通用性与高质量输出。近期,由德克萨斯A&M大学、斯坦福大学、Snap公司、CU Boulder大学、德克萨斯大…

    2025年11月21日
    13100
  • GPT-5.2深度解析:专业生产力工具的进化与多模态能力突破

    OpenAI近期正式发布了GPT-5.2系列模型,这一更新标志着人工智能在专业工作场景中的应用迈入新阶段。数据显示,ChatGPT企业版用户平均每日可节省40-60分钟的工作时间,重度用户每周节省超过10小时,这不仅是效率的提升,更是工作模式的根本性变革。GPT-5.2的核心目标在于释放更广泛的经济价值,通过技术优化推动各行业知识工作者的生产力跃升。 在专业…

    2025年12月12日
    11900
  • 神经符号融合:通往AGI的第三条道路,还是技术折衷的“双头怪兽”?

    在人工智能发展的历史长河中,符号主义与连接主义两大范式长期处于对立与交替主导的态势。符号AI曾凭借其严谨的逻辑规则体系,在早期AI研究中占据统治地位;而神经网络则通过数据驱动的学习范式,在深度学习浪潮中实现了颠覆性突破。然而,当大模型展现出惊人能力的同时,其固有的局限性——如幻觉问题、逻辑推理薄弱、可解释性差等——也日益凸显。这促使学界重新审视:单一范式是否…

    2025年12月16日
    12900
  • Meta斥资数十亿美元收购Manuas:AI工程化战略布局深度解析

    AI工程化 关注“鲸栖”小程序,掌握最新AI资讯

    2025年12月30日
    17600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注