英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

英伟达GTC 2026大会以一种不同寻常的方式开场——首席执行官黄仁勋迟到了15分钟。这场盛会汇聚了450家赞助企业、1000场技术分会、2000位演讲者以及110台机器人,其规模已远超一场普通的技术会议,更像是全球AI行业的年度朝圣。

舞台中央,身着标志性皮衣的黄仁勋,被赋予了新的称号——“Token之王”。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

在本次主题演讲中,他并未急于发布新品,而是用整整一个小时的时间,回顾了英伟达跨越25年的技术演进:从奠定游戏基础的GeForce显卡,到改变计算范式的CUDA架构,再到引领图形革命的RTX技术,直至支撑当今云计算与火爆的OpenClaw及Token经济的庞大生态。他勾勒出AI从感知生成推理执行的演进路径,强调每一步都意味着更多Token的生成与更庞大算力的消耗。

所有这些铺垫,最终指向一个惊人的数字:英伟达预计到2027年,其营收将达到至少1万亿美元

“去年GTC上,我看到了5000亿美元的高确信需求。今年,站在同一个舞台上,这个数字变成了1万亿美元,这覆盖了Blackwell和Rubin平台到2027年的订单。而且我确信,实际需求会比这更高。”

此言一出,现场掌声与欢呼雷动,英伟达股价也应声高涨。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Token工厂经济学:CEO必修课

“只有在英伟达的Keynote上,你才会看到去年的幻灯片再次出现。”

黄仁勋称,接下来这张图是全球每一位CEO都必须仔细研读的。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

这张图的纵轴代表Token吞吐量(每瓦特电力产生的Token数量),横轴代表Token速率(每秒生成Token的数量)。吞吐量好比工厂的产能,决定了规模与成本;速率则关联AI的“智能深度”——模型越大、上下文越长、思考越复杂,速率往往越低,但每个Token的价值也越高。

黄仁勋将这张图转化为一套清晰的商业模型:
* 免费层:高吞吐、低速率,用于市场获客。
* 中间层:定价3-6美元/百万Token,服务普通用户。
* 高级层:定价45美元/百万Token,用于大模型深度推理。
* 顶级层:定价150美元/百万Token,专供超长研究任务与关键路径的实时响应。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

性能是这一切的基础。第三方机构Semi Analysis此前的大规模测试显示,Grace Blackwell NVLink 72系统的每瓦Token吞吐量比上一代Hopper H200高出50倍——甚至高于黄仁勋自己宣称的35倍。对此,黄仁勋坦然承认自己“故意保留了余地”(sand bagging)。他强调,在数据中心功率存在物理上限(例如1GW)的约束下,每瓦性能直接决定了Token的最终成本

这也引出了下一代平台Vera Rubin存在的根本理由:将每瓦Token吞吐量再次提升2至10倍

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Vera Rubin:系统级突破,十年千万倍加速

“Hopper时代,我还会举起一块芯片给观众看,但那已经结束了。”黄仁勋说道,“去年我举起Hopper芯片的样子很可爱。但Vera Rubin不同——当人们想到Vera Rubin,想到的是整个系统。”

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Vera Rubin是英伟达有史以来最复杂的AI计算系统,它并非单一芯片,而是由7种芯片、5种机架垂直集成、端到端优化而成的巨型计算机,其核心组件包括:

  • Rubin GPU:全新架构,支持NVLink 72全互联,提供3.6 exaflops算力与260TB/s的全对全带宽。
  • Vera CPU:全新数据中心CPU,采用LPDDR5内存,能效比出众。其市场需求强劲,已独立发展为一项价值数十亿美元的业务。
  • Groq LP30:第三代“确定性数据流处理器”,拥有500MB片上SRAM,采用静态编译与软件调度,专为推理任务设计。
  • BlueField 4 DPU + CX9网卡:构成面向AI原生的全新存储基础设施。
  • NVLink Switch:第六代NVLink交换芯片,为大规模MoE模型提供极速的GPU间通信。
  • Spectrum X CPO交换机:全球首款量产的共封装光学交换机,实现电子信号到光子信号的直接转换。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

性能的飞跃是颠覆性的。在同一座1GW的数据中心内,从Grace Blackwell平台升级到Vera Rubin与Groq的组合,Token生成速率从200万/秒跃升至7亿/秒,两年时间提升350倍。相比之下,传统摩尔定律在同期仅能带来约1.5倍的提升。

如此巨大的提升并非单纯依靠晶体管堆叠。当算力密度达到当前水平,瓶颈早已转移到芯片之外:散热互联。Vera Rubin的答案在于两大变革:一个是水,一个是光

关于水:Vera Rubin采用100%液冷方案,甚至NVLink交换机也集成在液冷系统中。互联通过液冷模块内的板级/背板集成实现,外部线缆大幅减少,使得单个机架的安装时间从两天缩短至两小时。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

关于光:黄仁勋展示了世界首款量产的CPO(共封装光学)交换机

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

传统方案中,电信号需经过PCB走线、独立光模块进行电-光转换,再通过光纤传输,每一步都带来延迟与损耗。CPO技术将光学器件直接封装在芯片上,在硅片表面完成电-光转换,消除了独立光模块和长距离铜线。英伟达与台积电联合开发的CoUP封装工艺,目前是全球唯一的量产方案。这项技术打破了机架尺寸的物理限制,使72块GPU实现260TB/s全对全带宽成为可能。

黄仁勋明确表示,未来需要的是全面扩容:“我们既要更多的铜缆产能,也要更多的光芯片和CPO产能。”

从十年前的8卡DGX-1(170 TFLOPS)到今天的Vera Rubin NVLink 72系统(3.6 ExaFLOPS),英伟达实现了十年算力四千万倍的增长。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

高吞吐归Rubin,低延迟归Groq

然而,挑战依然存在。NVLink 72系统在高吞吐场景下近乎无敌,但当需求转向1000 Token/秒级别的极速推理时,其带宽便面临压力。这正是被英伟达在2025年底收购的推理芯片公司Groq的用武之地。

Groq以其独特的“LPU”架构闻名,它是一种确定性数据流处理器,依靠静态编译和编译器调度,片上集成高达500MB的SRAM,专为推理任务优化。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

业界曾好奇英伟达将如何整合Groq。答案并非替代GPU,而是协同作战。一颗Groq芯片拥有4GB SRAM,追求极致速度与低延迟;一颗Rubin GPU配备288GB HBM,提供海量容量。单独使用任一方都有局限:Groq难以承载万亿参数模型,而Rubin在极速Token生成上存在延迟。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

英伟达的解决方案是“分离式推理”。通过Dynamo推理框架,将推理流水线拆分:计算密集的预填充和注意力计算阶段交给Vera Rubin处理;而对带宽和延迟极度敏感的解码生成阶段,则卸载给Groq。这两种架构迥异的处理器通过高速以太网紧密耦合,将延迟减半。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

最终,这一组合在最高价值的推理层级上,实现了吞吐量再提升35倍的壮举,并成功解锁了此前无法实现的千Token/秒级极速生成新层级。

OpenClaw:AI 时代的“Linux 时刻”

发布会的最后一部分,黄仁勋将话题转向了开源项目 OpenClaw,并将其类比为人类历史上最受欢迎的开源项目之一。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

黄仁勋举例说明了 OpenClaw 的能力:有人利用它为其 60 岁的父亲自动化了整个精酿啤酒生意,实现了蓝牙连接酿造设备、自动生成销售网站,并支持顾客直接下单购买如“龙虾拉格啤酒”等产品。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

但黄仁勋更着重阐述了 OpenClaw 的本质。他使用操作系统的概念对其进行了重新定义:

  • 资源管理:能够调用大语言模型、访问文件系统、使用各类工具。
  • 调度系统:支持定时任务(cron jobs)、分步执行、生成子智能体(Agent)。
  • I/O 系统:实现多模态输入输出,例如识别用户手势并执行发送邮件等操作。

OpenClaw 开源了智能体计算机的操作系统。正如 Windows 开启了个人电脑时代,OpenClaw 正在开启个人智能体时代。

从 Windows(PC 时代)到 Linux(服务器时代),再到 HTML(互联网时代)、Kubernetes(云时代),每一次平台迁移都催生了一批改变世界的公司。黄仁勋指出,OpenClaw 标志着 Agent 时代 的到来,企业 IT 的全部逻辑即将被改写。

他直接断言:未来每家 SaaS 公司都将转型为 “智能体即服务”(Agent-as-a-Service) 公司。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

然而,智能体在企业网络中能够访问敏感信息、执行代码并进行对外通信。黄仁勋提醒道:“你把这三件事连起来大声说出来,再想一想……” 这凸显了潜在的安全风险。

为此,英伟达与 OpenClaw 合作推出了企业版 NeMo Claw,增加了策略引擎、网络护栏和隐私路由器等企业级安全与管理功能。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

黄仁勋分享了他对未来企业的终极想象:

未来每位工程师都会有一个年度 Token 预算。

他们年薪几十万美元,我会在此基础上再给他们一半的金额作为 Token 额度。

这已成为硅谷新的招聘筹码:你的录用通知中包含多少 Token 额度?

两个更多信息

发布会上,黄仁勋也对备受关注的下一代计算架构 Feynman(费曼) 进行了预告,并表示计算架构每年都会有新的进展。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

Feynman 将带来全新的 GPU、LPU(LP 40)和 CPU(Rosa)。新一代的 BlueField 5 将连接下一代 CPU 与 SuperNIC CX10,并配合新的 Kyber 技术实现铜缆与光学的双重扩展——这意味着 Feynman 将首次同时支持基于铜缆和光学封装的水平扩展。

黄仁勋强调,无论是铜缆、光学还是共封装光学(CPO),未来都需要更高的容量与带宽,而这正是 Feynman 架构的核心突破。

此外,他还透露,英伟达正与合作伙伴联合开发 NVIDIA Space One,一台计划部署在太空的数据中心计算机,旨在开启“太空算力”的新篇章。

英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

太空环境没有对流和传导,只有辐射散热。黄仁勋谈及挑战时表示:

我们得想办法在太空里给 GPU 散热。不过我们有很多优秀的工程师在搞这件事。

将 GPU 送上近地轨道,这或许是“AI 无处不在”最字面意义上的诠释了。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/26016

(0)
上一篇 2026年3月16日 下午5:15
下一篇 2026年3月17日 上午11:03

相关推荐

  • Dual-Flow:颠覆传统对抗攻击范式,实现多目标多模型黑盒攻击新突破

    在人工智能安全领域,对抗攻击一直是研究的热点与难点。近日,清华大学与蚂蚁数科联合在NeurIPS 2024会议上提出的Dual-Flow框架,为这一领域带来了革命性的突破。该框架通过创新的双流结构和训练机制,实现了对多种模型、多种类别的黑盒攻击,且无需依赖目标模型结构或梯度信息,为AI模型的安全性评估与防御体系构建提供了全新的视角与工具。 Dual-Flow…

    2025年12月15日
    30700
  • PyTorch之父Soumith Chintala离职Meta:一个时代的结束与开源AI工具的新征程

    近日,PyTorch创始人兼Meta长期工程师Soumith Chintala宣布将于11月17日正式离职,结束他在Meta长达11年的职业生涯。这一消息迅速在AI社区引发广泛关注,不仅因为Chintala是PyTorch这一全球主流AI框架的核心缔造者,更因其离职标志着开源AI工具发展史上的一个重要节点。本文将从技术影响、行业生态、个人动机及未来展望四个维…

    2025年11月7日
    25900
  • 谷歌Gemma 4震撼发布:31B模型击败20倍体量对手,手机离线跑多模态,Apache 2.0协议全面开源

    谷歌发布Gemma 4模型家族:31B版本性能超越十倍体量对手,全系列支持多模态并采用Apache 2.0协议 谷歌最新发布的Gemma 4开源模型家族表现强劲。其中,参数量为310亿(31B)的密集模型在性能基准测试中,超越了参数量大10-20倍的对手,例如Qwen3.5-397B和DeepSeek v3.2-671B。 此次发布的Gemma 4系列共包含…

    2026年4月3日
    1.2K00
  • AI安全新突破:揭秘LLMs新型攻击链与高效防御策略

    AI安全新突破:揭秘LLMs新型攻击链与高效防御策略(一) 本周的研究聚焦于大型语言模型面临的新型攻击方式与创新防御策略。这些成果揭示了模型在文本布局、推理和生成过程中的固有弱点,展现了AI安全领域的最新进展。分析表明,当前攻击方法的成功率显著提升,而相应的防御技术也正朝着高效、实用和精细化的方向发展,这对构建更可靠、更安全的AI系统至关重要。 一、关键发现…

    2026年1月19日
    1.6K00
  • AI营销新趋势:快手商业AI如何打通全链路,破解行业协同难题

    AI营销新趋势:快手商业AI如何打通全链路,破解行业协同难题 AI进入营销行业,已经是定局。 市场研究数据显示,去年中国AI营销市场规模已达数百亿元,并保持高速增长。这个增速背后,是整个行业链条——从内容生产到投放决策——的集中押注。 但市场大,不等于落地深。 当前绝大多数AI营销工具仍以单点形态存在,各自解决一个局部问题,而不同环节之间,还是要靠广告主自己…

    2026年3月31日
    19900