英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

英伟达GTC 2026大会以一种不同寻常的方式开场——首席执行官黄仁勋迟到了15分钟。这场盛会汇聚了450家赞助企业、1000场技术分会、2000位演讲者以及110台机器人,其规模已远超一场普通的技术会议,更像是全球AI行业的年度朝圣。

舞台中央,身着标志性皮衣的黄仁勋,被赋予了新的称号——“Token之王”。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

在本次主题演讲中,他并未急于发布新品,而是用整整一个小时的时间,回顾了英伟达跨越25年的技术演进:从奠定游戏基础的GeForce显卡,到改变计算范式的CUDA架构,再到引领图形革命的RTX技术,直至支撑当今云计算与火爆的OpenClaw及Token经济的庞大生态。他勾勒出AI从感知生成推理执行的演进路径,强调每一步都意味着更多Token的生成与更庞大算力的消耗。

所有这些铺垫,最终指向一个惊人的数字:英伟达预计到2027年,其营收将达到至少1万亿美元

“去年GTC上,我看到了5000亿美元的高确信需求。今年,站在同一个舞台上,这个数字变成了1万亿美元,这覆盖了Blackwell和Rubin平台到2027年的订单。而且我确信,实际需求会比这更高。”

此言一出,现场掌声与欢呼雷动,英伟达股价也应声高涨。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Token工厂经济学:CEO必修课

“只有在英伟达的Keynote上,你才会看到去年的幻灯片再次出现。”

黄仁勋称,接下来这张图是全球每一位CEO都必须仔细研读的。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

这张图的纵轴代表Token吞吐量(每瓦特电力产生的Token数量),横轴代表Token速率(每秒生成Token的数量)。吞吐量好比工厂的产能,决定了规模与成本;速率则关联AI的“智能深度”——模型越大、上下文越长、思考越复杂,速率往往越低,但每个Token的价值也越高。

黄仁勋将这张图转化为一套清晰的商业模型:
* 免费层:高吞吐、低速率,用于市场获客。
* 中间层:定价3-6美元/百万Token,服务普通用户。
* 高级层:定价45美元/百万Token,用于大模型深度推理。
* 顶级层:定价150美元/百万Token,专供超长研究任务与关键路径的实时响应。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

性能是这一切的基础。第三方机构Semi Analysis此前的大规模测试显示,Grace Blackwell NVLink 72系统的每瓦Token吞吐量比上一代Hopper H200高出50倍——甚至高于黄仁勋自己宣称的35倍。对此,黄仁勋坦然承认自己“故意保留了余地”(sand bagging)。他强调,在数据中心功率存在物理上限(例如1GW)的约束下,每瓦性能直接决定了Token的最终成本

这也引出了下一代平台Vera Rubin存在的根本理由:将每瓦Token吞吐量再次提升2至10倍

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Vera Rubin:系统级突破,十年千万倍加速

“Hopper时代,我还会举起一块芯片给观众看,但那已经结束了。”黄仁勋说道,“去年我举起Hopper芯片的样子很可爱。但Vera Rubin不同——当人们想到Vera Rubin,想到的是整个系统。”

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Vera Rubin是英伟达有史以来最复杂的AI计算系统,它并非单一芯片,而是由7种芯片、5种机架垂直集成、端到端优化而成的巨型计算机,其核心组件包括:

  • Rubin GPU:全新架构,支持NVLink 72全互联,提供3.6 exaflops算力与260TB/s的全对全带宽。
  • Vera CPU:全新数据中心CPU,采用LPDDR5内存,能效比出众。其市场需求强劲,已独立发展为一项价值数十亿美元的业务。
  • Groq LP30:第三代“确定性数据流处理器”,拥有500MB片上SRAM,采用静态编译与软件调度,专为推理任务设计。
  • BlueField 4 DPU + CX9网卡:构成面向AI原生的全新存储基础设施。
  • NVLink Switch:第六代NVLink交换芯片,为大规模MoE模型提供极速的GPU间通信。
  • Spectrum X CPO交换机:全球首款量产的共封装光学交换机,实现电子信号到光子信号的直接转换。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

性能的飞跃是颠覆性的。在同一座1GW的数据中心内,从Grace Blackwell平台升级到Vera Rubin与Groq的组合,Token生成速率从200万/秒跃升至7亿/秒,两年时间提升350倍。相比之下,传统摩尔定律在同期仅能带来约1.5倍的提升。

如此巨大的提升并非单纯依靠晶体管堆叠。当算力密度达到当前水平,瓶颈早已转移到芯片之外:散热互联。Vera Rubin的答案在于两大变革:一个是水,一个是光

关于水:Vera Rubin采用100%液冷方案,甚至NVLink交换机也集成在液冷系统中。互联通过液冷模块内的板级/背板集成实现,外部线缆大幅减少,使得单个机架的安装时间从两天缩短至两小时。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

关于光:黄仁勋展示了世界首款量产的CPO(共封装光学)交换机

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

传统方案中,电信号需经过PCB走线、独立光模块进行电-光转换,再通过光纤传输,每一步都带来延迟与损耗。CPO技术将光学器件直接封装在芯片上,在硅片表面完成电-光转换,消除了独立光模块和长距离铜线。英伟达与台积电联合开发的CoUP封装工艺,目前是全球唯一的量产方案。这项技术打破了机架尺寸的物理限制,使72块GPU实现260TB/s全对全带宽成为可能。

黄仁勋明确表示,未来需要的是全面扩容:“我们既要更多的铜缆产能,也要更多的光芯片和CPO产能。”

从十年前的8卡DGX-1(170 TFLOPS)到今天的Vera Rubin NVLink 72系统(3.6 ExaFLOPS),英伟达实现了十年算力四千万倍的增长。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

高吞吐归Rubin,低延迟归Groq

然而,挑战依然存在。NVLink 72系统在高吞吐场景下近乎无敌,但当需求转向1000 Token/秒级别的极速推理时,其带宽便面临压力。这正是被英伟达在2025年底收购的推理芯片公司Groq的用武之地。

Groq以其独特的“LPU”架构闻名,它是一种确定性数据流处理器,依靠静态编译和编译器调度,片上集成高达500MB的SRAM,专为推理任务优化。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

业界曾好奇英伟达将如何整合Groq。答案并非替代GPU,而是协同作战。一颗Groq芯片拥有4GB SRAM,追求极致速度与低延迟;一颗Rubin GPU配备288GB HBM,提供海量容量。单独使用任一方都有局限:Groq难以承载万亿参数模型,而Rubin在极速Token生成上存在延迟。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

英伟达的解决方案是“分离式推理”。通过Dynamo推理框架,将推理流水线拆分:计算密集的预填充和注意力计算阶段交给Vera Rubin处理;而对带宽和延迟极度敏感的解码生成阶段,则卸载给Groq。这两种架构迥异的处理器通过高速以太网紧密耦合,将延迟减半。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

最终,这一组合在最高价值的推理层级上,实现了吞吐量再提升35倍的壮举,并成功解锁了此前无法实现的千Token/秒级极速生成新层级。

OpenClaw:AI 时代的“Linux 时刻”

发布会的最后一部分,黄仁勋将话题转向了开源项目 OpenClaw,并将其类比为人类历史上最受欢迎的开源项目之一。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

黄仁勋举例说明了 OpenClaw 的能力:有人利用它为其 60 岁的父亲自动化了整个精酿啤酒生意,实现了蓝牙连接酿造设备、自动生成销售网站,并支持顾客直接下单购买如“龙虾拉格啤酒”等产品。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

但黄仁勋更着重阐述了 OpenClaw 的本质。他使用操作系统的概念对其进行了重新定义:

  • 资源管理:能够调用大语言模型、访问文件系统、使用各类工具。
  • 调度系统:支持定时任务(cron jobs)、分步执行、生成子智能体(Agent)。
  • I/O 系统:实现多模态输入输出,例如识别用户手势并执行发送邮件等操作。

OpenClaw 开源了智能体计算机的操作系统。正如 Windows 开启了个人电脑时代,OpenClaw 正在开启个人智能体时代。

从 Windows(PC 时代)到 Linux(服务器时代),再到 HTML(互联网时代)、Kubernetes(云时代),每一次平台迁移都催生了一批改变世界的公司。黄仁勋指出,OpenClaw 标志着 Agent 时代 的到来,企业 IT 的全部逻辑即将被改写。

他直接断言:未来每家 SaaS 公司都将转型为 “智能体即服务”(Agent-as-a-Service) 公司。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

然而,智能体在企业网络中能够访问敏感信息、执行代码并进行对外通信。黄仁勋提醒道:“你把这三件事连起来大声说出来,再想一想……” 这凸显了潜在的安全风险。

为此,英伟达与 OpenClaw 合作推出了企业版 NeMo Claw,增加了策略引擎、网络护栏和隐私路由器等企业级安全与管理功能。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

黄仁勋分享了他对未来企业的终极想象:

未来每位工程师都会有一个年度 Token 预算。

他们年薪几十万美元,我会在此基础上再给他们一半的金额作为 Token 额度。

这已成为硅谷新的招聘筹码:你的录用通知中包含多少 Token 额度?

两个更多信息

发布会上,黄仁勋也对备受关注的下一代计算架构 Feynman(费曼) 进行了预告,并表示计算架构每年都会有新的进展。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Feynman 将带来全新的 GPU、LPU(LP 40)和 CPU(Rosa)。新一代的 BlueField 5 将连接下一代 CPU 与 SuperNIC CX10,并配合新的 Kyber 技术实现铜缆与光学的双重扩展——这意味着 Feynman 将首次同时支持基于铜缆和光学封装的水平扩展。

黄仁勋强调,无论是铜缆、光学还是共封装光学(CPO),未来都需要更高的容量与带宽,而这正是 Feynman 架构的核心突破。

此外,他还透露,英伟达正与合作伙伴联合开发 NVIDIA Space One,一台计划部署在太空的数据中心计算机,旨在开启“太空算力”的新篇章。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

太空环境没有对流和传导,只有辐射散热。黄仁勋谈及挑战时表示:

我们得想办法在太空里给 GPU 散热。不过我们有很多优秀的工程师在搞这件事。

将 GPU 送上近地轨道,这或许是“AI 无处不在”最字面意义上的诠释了。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/26016

(0)
上一篇 1天前
下一篇 18小时前

相关推荐

  • OpenAI人才地震再升级!核心VP主动降级跳槽Anthropic,只为回归一线RL研究

    OpenAI人才地震再升级!核心VP主动降级跳槽Anthropic,只为回归一线RL研究 前OpenAI研究副总裁马克斯·施瓦泽(Max Schwarzer)近日宣布离职,并已加入竞争对手Anthropic。这位主导了o1、o3及GPT-5系列模型后期训练的核心人物,其离职理由并非被高薪挖角,而是“渴望回归一线独立贡献者(IC)的研究工作”。 施瓦泽在Ope…

    2026年3月5日
    16200
  • LeMiCa:突破视频生成瓶颈的全局最优缓存加速框架

    当前,基于Transformer架构的DiT等扩散模型在视频生成领域取得了显著进展,生成效果逐渐逼近真实拍摄水平。然而,这些模型普遍面临推理时间长、算力成本高、生成速度难以提升的瓶颈问题。随着视频生成长度增加和分辨率提高,这一瓶颈已成为制约视频创作体验的关键障碍。 来自中国联通数据科学与人工智能研究院的研究团队提出了LeMiCa(Lexicographic …

    2025年11月26日
    18100
  • 百度文心首创Group-MAS架构:多Agent群聊如何重构AI协作场景

    文心APP的群里,最近有点“AI多势众”。 此群非一般的群,正是文心APP最近正在内测的行业首个“多人、多Agent”群聊功能。 该怎么形容它最贴切?一进这个群,就相当于进入了一个微型“办事处”,有几位随时待命、各司其职的Agent专员,能真正替你办事、帮你支招,沟通效率还很高。 它的用处很实在。 比如年初体检季,家人对着报告单上几个箭头忧心忡忡,亲戚群里七…

    2026年2月2日
    7500
  • Video2X:AI驱动的视频无损超清修复神器,让老旧影像重获新生

    随着显示器分辨率不断提升,4K甚至更高规格的屏幕已逐渐普及。然而,硬件规格的提升却让低分辨率片源的观看体验问题愈发凸显。 当我们试图重温硬盘中珍藏多年的经典影片时,常常因其仅有360P或480P的原始画质而倍感困扰——画面充满噪点,细节模糊不清,严重影响观感。 针对这一痛点,一款名为 Video2X 的开源工具提供了出色的解决方案。 其核心功能非常专注:运用…

    2026年1月25日
    18500
  • 多模型协同决策:LLM议会系统如何重塑AI评估范式

    在人工智能技术快速迭代的当下,大语言模型(LLM)的性能评估与协同应用正成为行业关注的焦点。近期,知名AI研究者卡帕西(Karpathy)推出的“LLM议会”(LLM Council)项目,通过构建一个多模型协同决策的Web应用,为这一领域带来了全新的探索视角。该系统不仅实现了多个主流大模型的并行调用与答案生成,更引入了模型间匿名互评与主席模型汇总的机制,为…

    2025年11月23日
    16300