【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

Claude 4.5与Gemini 3即将发布,但焦点在DeepSeek。其V3.2版本疑似官方预热,而十月将至的V4版本则被曝将实现1M上下文长度、GRPO Turbo多步思考及更高推理效率等重大升级。

最近科技圈可一点都没闲着,各家都在密谋放大招。先是传了很久的 Claude 4.5 预计未来一两周内亮相,Google 的 Gemini 3 也瞄准了咱们国庆档期。不过今天我们要重点聊的,是 DeepSeek 家的两条新动态——V4 和 V3.2。

关于 DeepSeek-V3.2 的最新线索
有开发者发现,DeepSeek 团队在 HuggingFace 上悄悄创建了名为 “DeepSeek-V3.2-Base” 的模型卡。有意思的是,这个页面在一个下午内反复出现又消失了好几次,这种“欲盖弥彰”的操作反而坐实了新版本的存在。

【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

比起网上流传的各种猜测,这条来自官方渠道的线索显然更值得关注。不少人猜测,这可能是为接下来的 V4 版本做预热——是不是颇有 OpenAI 的营销风格?

【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

DeepSeek-V4:性能大幅跃升
根据社区爆料,DeepSeek V4 计划在10月发布,而且这次不只是版本号升级那么简单。据传它将带来三大突破:

  • 上下文窗口扩展至 1M Tokens
  • 支持 GRPO Turbo 多步思考模式
  • 推理速度更快,成本更低

后两点尤其可信。回顾2023年以来,Qwen 和 DeepSeek 的技术路线就有着诸多相似之处。比如 GRPO 算法年初随 DeepSeekMath 发布后,年中的 Qwen2-Math 就展示了相似的技术特征。虽然当时 GRPO 尚未开源,但技术思路的同步确实引人遐想。

【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

技术前瞻:长文本处理将迎新突破
值得一提的是,Qwen 最近发布的 Qwen3-Next 采用了原生稀疏注意力(NSA)技术。该技术通过选择性计算关键词关系,有效解决了长序列处理中的计算瓶颈。这也让 DeepSeek V4 实现 1M 上下文窗口的传闻显得更加合理——毕竟两家在长文本技术上的进展一直相辅相成。

最后确认个好消息:这些新模型都会开源!

以上就是本期全部爆料。哪个模型最让你期待?欢迎在评论区分享你的看法~

参考资料:
[1] https://x.com/deepsseek/status/1972426156222611688

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/4118

(1)
上一篇 2025年9月29日 下午5:37
下一篇 2025年10月1日 下午5:15

相关推荐

  • AI驱动PC产业新周期:联想财报揭示硬件巨头的智能化转型路径

    近期IDC发布的2025年第三季度全球PC出货量数据显示,市场总量达到7590万台,同比增长9.4%,实现连续四个季度的正增长。这一数据有力驳斥了“PC行业触顶论”,表明在AI技术赋能下,传统硬件产业正迎来结构性复苏。作为行业风向标的联想集团,其最新财报更揭示了AI如何重塑PC价值链,推动硬件制造商向智能化服务商转型。 联想2025/26财年第二财季财报显示…

    2025年11月23日
    38700
  • UNeMo:多模态世界模型与分层预测反馈机制重塑视觉-语言导航新范式

    在具身智能(Embodied AI)领域,视觉-语言导航(VLN)作为核心任务之一,要求智能体仅凭视觉图像和自然语言指令,在未知环境中自主完成目标导航。随着大语言模型(LLM)的兴起,基于LLM的导航方法虽取得一定进展,但仍面临推理模态单一、优化目标冲突等关键瓶颈。深圳大学李坚强教授团队联合北京理工莫斯科大学等机构提出的UNeMo框架,通过多模态世界模型(M…

    2025年12月10日
    57500
  • 英伟达财报深度解析:2026年AI算力万亿市场,数据中心业务占比超88%引领增长

    2026年AI算力市场的竞争格局与增长轨迹,与英伟达的战略动向紧密相连。从2025财年财报的超预期表现,到2026财年的强劲业绩指引,再到管理层对远期芯片收入预期的上调,英伟达不仅以财务数据验证了全球AI算力需求的持续性与韧性,更通过其技术路线与业务布局,揭示了万亿级市场的未来轮廓。 本文将以英伟达2025财年财报为核心切入点,系统分析其各业务板块表现,解读…

    2026年3月2日
    1.1K00
  • 11.77亿资本押注卡车新势力「一哥」,L2升维路线率先在商用车跑通!

    贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI 在技术门槛高、商业化挑战大的硬核赛道,总有玩家能够逆周期成长—— 2026年初,自动驾驶赛道迎来首笔重磅投资:卡车新势力DeepWay深向宣布完成总额11.77亿元的Pre-IPO轮融资。 DeepWay深向成立仅5年,却持续获得VC与产业资本青睐,Pre-IPO轮次历经多轮扩充,现已进入冲刺港交所的阶…

    2026年1月27日
    45200
  • OpenClaw重塑硬件生态:从AI眼镜到机器狗,如何成为AI的操作系统?

    OpenClaw正在悄然改变着智能硬件的消费逻辑与开发范式。 以个人消费决策为例:当用户考虑购买一款运动手表时,首要的考量因素可能不再是品牌或传统功能,而是它能否接入OpenClaw。这一需求的源头,恰恰也来自OpenClaw本身。例如,当用户让OpenClaw制定并监督健身计划时,每次锻炼后仍需手动输入数据,过程繁琐。若能实现运动手表与OpenClaw的数…

    2026年3月9日
    62000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注