DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

刚刚,DeepSeek-V4来了!

预览版正式上线并同步开源

一共两个版本:

  • DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M;
  • DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

官方原话是:Agent能力、世界知识和推理性能上均实现国内与开源领域的领先

并且:

目前DeepSeek-V4已经成为公司内部员工使用的Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。但仍与Opus 4.6思考模型存在一定差距。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

目前官网和APP都上了,API服务也已同步更新。

大家都关心的国产算力方面,划重点,下半年批量上华为算力

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

顶配和性价比之选,两个版本一起开

这次V4一口气发了两个版本。

V4-Pro,性能比肩顶级闭源模型。

官方给出的判断有三条:

  • Agent能力大幅提高:在Agentic能力Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。内部测评中,Agent Coding模式下,V4体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距。
  • 丰富的世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。
  • 世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

V4-Flash,更小更快的经济版。推理能力接近Pro,世界知识储备稍逊一筹,但参数和激活更小,API更便宜。

在Agent任务方面,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。

在洗车测试上,V4也是快速通过。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

而在“绝望的父亲”这个经典的生物学场景当中,DeepSeek-V4并没有一轮get到红绿色盲这个关键点(根据遗传学规律,如果一名女性是红绿色盲,其生物学父亲必然也是)。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

百万上下文实现标配

值得一提的是,从今天开始,1M上下文是DeepSeek所有官方服务的标配。

一年前,1M上下文还是Gemini独家的王牌;其他所有闭源模型要么128K要么200K;开源这边几乎没人玩得起这个量级。

DeepSeek直接把百万上下文从一个「高端功能」挪成了「水电煤」。

而且开源。他们怎么做到的,发布稿里直接给了答案——

V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力一起用。相比传统方法,对计算和显存的需求大幅降低。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

DSA不是新词。半年前V3.2-Exp那次更新首次引入,当时外界关注度不高,因为跑分和V3.1-Terminus几乎一样,看起来像一次没什么料的中间版本。

现在回头看,那是V4的地基。

Agent能力专项优化

Agent这边,V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了适配和优化,代码任务、文档生成任务都有提升。

发布稿里还附了一张V4-Pro在某Agent框架下生成的PPT内页示例。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

API价格

API这边,V4-Pro和V4-Flash同步上线,支持OpenAI ChatCompletions接口和Anthropic接口两套。

base_url不变,model参数改成deepseek-v4-pro或deepseek-v4-flash即可调用。

两个版本最大上下文都是1M,都同时支持非思考模式和思考模式。思考模式下可以通过reasoning_effort参数调强度,两档high和max。官方建议复杂Agent场景直接上max。

DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

这里有个重点——下半年批量上华为算力

此外,旧模型名要下架。

deepseek-chat和deepseek-reasoner将在三个月后(2026年7月24日)停用,当前阶段内这两个名字分别指向V4-Flash的非思考和思考模式。

对个人开发者影响不大,改一个model参数。对接了生产环境的公司,这三个月要去做迁移。

One more thing

发布稿的结尾,DeepSeek自己引了一句话。

「不诱于誉,不恐于诽,率道而行,端然正己。」

这是荀子《非十二子》里的一句。字面意思是,不被赞誉诱惑,不被诽谤吓到,按自己认定的道往前走,端正自己。

放在今天这个场景里,有点意思。

过去半年,关于V4什么时候发、是不是跳票、是不是已经被别家超越、是不是已经被Claude蒸馏数据搞定了之类的传言在中文和英文AI圈来来回回跑了好几轮。年初甚至还有人信誓旦旦说V4会在春节前发,结果等到了四月底。

他们没回应过一次。

然后在某个周五的上午,把V4放出来,同步开源,同步上线官网和App,同步更新API,顺便把内部员工已经弃用Claude的事实写进发布稿。

没有路线图,没有直播,没有访谈。

率道而行这四个字,听着像是一句口号。但如果你把过去半年V3.2那次「没什么亮点」的Exp版本、DSA那套为V4铺了半年的稀疏注意力、1M上下文从王牌变成标配的这条路径放在一起看。

DeepSeek已经做到了。

DeepSeek-V4模型开源链接:

[1]https://huggingface.co/collections/deepseek-ai/deepseek-v4
[2]https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4技术报告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/31856

(0)
上一篇 5小时前
下一篇 5小时前

相关推荐

  • 从Vibe Coding到工程智能体:InfCode如何突破企业级AI编程的语义定位瓶颈

    人工智能编程正经历从概念验证到工程落地的关键转型。自Andrej Karpathy提出“Vibe Coding”概念以来,通过自然语言提示直接生成可运行代码的能力确实展现了AI编程的潜力,但这种基于“感觉”的编程模式在企业级复杂工程场景中逐渐暴露出局限性。 Vibe Coding的核心优势在于快速原型开发,开发者仅需一句提示词如“编写一个Python代码,可…

    2025年12月5日
    37400
  • Game-TARS:从游戏玩家到通用计算机用户的革命性跨越——基于统一键盘鼠标动作空间的智能体范式

    在人工智能与游戏交互的交叉领域,一项突破性进展正在重新定义智能体的能力边界。字节跳动Seed团队最新发布的Game-TARS通用型游戏智能体,不仅实现了在《我的世界》、《神庙逃亡》、《星露谷》等多样化游戏环境中的卓越表现,更通过零样本迁移能力在未见过的3D网页游戏中展现惊人适应性。 这一成就的背后,是团队对智能体交互范式的根本性重构——从传统的函数调用模式转…

    2025年10月30日
    29200
  • 阿里云Operation Intelligence:大模型如何重塑AIOps,让运维从“人工救火”到“系统自愈”

    大模型的出现,给许多行业带来了颠覆性的改变,运维这个向来被视为稳定、保守的领域也不例外。虽然“AIOps”这个概念早在 2016 年由 Gartner 提出,但早期的智能运维更多是利用大数据和机器学习对传统运维流程进行效率上的提升。十年后的今天,大模型的强大能力,正推动着 AIOps 从辅助工具,演进为数智化转型中不可或缺的核心基础设施,让运维真正迈入智能化…

    2026年1月29日
    57000
  • MiMo-Embodied:全球首个跨具身基座模型的技术突破与产业影响

    在人工智能技术快速演进的当下,具身智能与自动驾驶作为两大前沿领域,长期面临着知识迁移与能力统一的挑战。传统视觉语言模型(VLMs)往往局限于单一场景——要么专注于室内机器人操作,要么聚焦于户外驾驶任务,这种割裂状态严重制约了智能体在动态物理世界中的综合交互能力。近日,小米汽车陈龙团队开源了全球首个打通自动驾驶与具身操作场景的跨具身(X-Embodied)基座…

    2025年11月25日
    33900
  • GLM-4.7震撼发布:编程与推理能力全面突破,多项基准测试超越GPT-5.2与Claude 4.5

    经过多日预热,12月22日,智谱AI正式发布新一代旗舰模型GLM-4.7。该模型在编程和复杂推理能力上实现重大突破,旨在对标当前顶尖闭源模型。 基准测试表现亮眼 根据官方信息,GLM-4.7在编程、复杂推理和工具使用方面均有显著提升,同时在聊天、创意写作和角色扮演等场景下的能力也有所增强。 官方公布的测试结果显示,GLM-4.7在多项关键基准测试中表现优异:…

    2025年12月23日
    1.2K00