英伟达CES 2026重磅发布:Rubin架构GPU性能飙升5倍,物理AI平台Cosmos引领全栈生态革命
刚刚,英伟达CEO黄仁勋在全球最大消费电子展CES 2026上发布了全新AI产品。这是五年来英伟达首次在CES上未发布游戏显卡,其战略重心已明确转向全力投入AI。

这一战略的成果引人瞩目。下一代Rubin架构GPU在NVFP4数据格式下,推理与训练性能分别达到Blackwell GB200的5倍和3.5倍。

黄仁勋此次还带来了覆盖五大领域的全新发布,包括:
* 面向智能体AI的NVIDIA Nemotron模型家族
* 面向物理AI的NVIDIA Cosmos平台
* 面向自动驾驶开发的全新NVIDIA Alpamayo模型家族
* 面向机器人领域的NVIDIA Isaac GR00T
* 面向生物医学的NVIDIA Clara
同时,英伟达宣布将持续向社区开源其训练框架及多模态数据集。开源数据集规模庞大,包含10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构以及100TB车辆传感器数据。
本次发布的核心主题直指物理AI。

有评论认为,这标志着英伟达将其竞争优势从芯片层进一步拓展至全栈平台层(模型+数据+工具),以此持续拉动GPU与基础设施需求,并显著增强用户与生态的锁定效应。

值得注意的是,国产开源模型在本次发布中被多次提及。黄仁勋在演讲开篇便提及DeepSeek,Kimi K2、Qwen等模型也出现在展示PPT中。

正式推出Vera Rubin NVL72
黄仁勋正式发布了英伟达下一代AI数据中心机柜架构Vera Rubin,并披露了其架构细节。
Vera Rubin NVL72机架由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4数据处理单元(DPU)以及Spectrum-6以太网交换机。

在NVFP4数据类型下,Rubin GPU的推理性能可达50 PFLOPS,是Blackwell GB200的5倍;其训练性能为35 PFLOPS,是Blackwell的3.5倍。为支撑如此强大的算力,每颗Rubin GPU封装了8组HBM4内存,提供288GB容量和22 TB/s的带宽。
随着主流大模型转向MoE架构,模型规模得以高效扩展,但专家模块间的通信对节点间带宽提出了极高要求。为此,Vera Rubin引入了用于规模内扩展网络的NVLink 6。它将单GPU的互连带宽提升至3.6 TB/s(双向)。每颗NVLink 6交换芯片提供28 TB/s的带宽,每个Vera Rubin NVL72机架配备9颗此类芯片,总规模内带宽高达260 TB/s。
NVIDIA Vera CPU集成了88个定制的Olympus Arm核心,采用英伟达称为“空间多线程”的设计,最多可同时运行176个线程。用于连接Vera CPU与Rubin GPU的NVLink C2C互连,其带宽提升了一倍,达到1.8 TB/s。每颗Vera CPU可寻址最多1.5 TB的SOCAMM LPDDR5X内存,内存带宽最高可达1.2 TB/s。

为将Vera Rubin NVL72机架扩展为每组8个机架的DGX SuperPod,英伟达推出了一对采用共封装光学技术的Spectrum-X以太网交换机,均基于Spectrum-6芯片构建。每颗Spectrum-6芯片提供102.4 Tb/s的带宽。基于此,英伟达推出了两款交换机:SN688提供409.6 Tb/s总带宽,支持512个800G或2048个200G以太网端口;SN6810提供102.4 Tb/s带宽,可配置为128个800G或512个200G端口。两款交换机均采用液冷设计,英伟达称其在能效、可靠性和运行时间上优于非硅光子技术硬件。
随着模型上下文窗口扩展至数百万token,存储交互历史的键值缓存操作已成为推理性能瓶颈。为突破此限制,英伟达推出新硬件BlueField-4 DPU,构建了一个名为“推理上下文内存存储平台”的新内存层级。


该存储层旨在实现键值缓存数据在AI基础设施中的高效共享与复用,从而提升系统响应速度与吞吐能力,并助力智能体AI架构实现可预测、高能效的规模扩展。这也是Vera Rubin首次将英伟达的可信执行环境扩展至整个机架级别。
整体而言,每个Vera Rubin NVL72机架可提供:
* 3.6 exaFLOPS的NVFP4推理性能
* 2.5 exaFLOPS的NVFP4训练性能
* 54 TB的LPDDR5X内存(连接至Vera CPU)
* 20.7 TB的HBM4内存,带宽达1.6 PB/s
为保障系统持续高效运行,英伟达在机架层面引入了多项改进:无缆化模块托盘设计使组件更换更快;增强的NVLink弹性能力支持零停机维护;第二代RAS引擎可在不中断服务的情况下完成健康检测。
英伟达表示,与Blackwell相比,Vera Rubin训练MoE模型所需的GPU数量仅为四分之一;在MoE推理场景下,其每token成本最高可降低10倍。这意味着Rubin能在相同机架空间内,大幅提升训练吞吐量并生成更多token。
据介绍,构建Vera Rubin NVL72所需的六类芯片已全部从晶圆厂交付,英伟达预计将在2026年下半年启动其规模化量产。
自动驾驶全新开源模型系列发布
英伟达重磅推出了面向安全推理自动驾驶的全新开源模型系列——Alpamayo。

全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数量达100亿。它能让自动驾驶车辆理解周围环境,并对自身决策行为做出解释。模型接收车辆运动历史、多摄像头实时视频及用户指令三类信息,经推理后生成驾驶决策、因果推理结果及规划行驶轨迹。

配套推出的还有开源仿真框架AlpacaSim,支持在各种环境与边缘场景中对基于推理的自动驾驶模型进行闭环训练与评估。
此外,英伟达发布了一个包含1700小时驾驶数据的开源数据集。这些数据采集自全球最广泛的地理区域与环境条件,涵盖了推动推理架构发展所必需的罕见及复杂真实边缘场景。
落地方面,Alpamayo将率先搭载于2025年第二季度在欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级逐步推送高速公路脱手驾驶、城市全场景自动驾驶、端到端自动泊车等功能,并计划登陆美国市场。

英伟达基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景也一同亮相,通过连接软件开发商、整车厂/出行平台、硬件供应商,覆盖了全产业链。

Nemotron再推专项模型
NVIDIA Nemotron在AI智能体领域进一步拓展,在已发布的Nemotron 3开放模型与数据基础上,推出了针对语音、RAG以及安全三大场景的专项模型。

其中,Nemotron Speech 包含新的自动语音识别(ASR)模型,不仅语音识别性能强,而且能支持实时字幕生成这样的实时低延迟场景,速度比同类模型快10倍。英伟达表示,目前博世已采用该模型实现司机与车辆之间的交互。
Nemotron RAG 则搭载新的视觉语言模型,能精准处理多语言、多模态数据,有效提升文档搜索效率。
Nemotron Safety 系列模型专注于增强AI应用的安全性与可信度,具体包括支持更多语言的Llama Nemotron内容安全模型,以及高精度检测敏感数据的Nemotron PII模型。
机器人推理大脑Cosmos升级
活动现场,黄仁勋宣布英伟达为机器人推出的推理“大脑”Cosmos再度升级。
Cosmos主要被用来生成符合现实世界物理规律的合成数据,自发布以来,已被Figure、Agility Robotics、通用汽车等一众知名机器人和自动驾驶公司采用。

这次全新发布了:
- Cosmos Reason 2:一款全新的、排名领先的视觉-语言推理模型(VLM)。它能够帮助机器人与AI智能体更精准地感知、理解并与物理世界进行交互。
- Cosmos Transfer 2.5与Cosmos Predict 2.5:两款领先的模型,可在各种不同的环境与条件下,生成大规模的合成视频。

英伟达还基于Cosmos模型,为各类物理AI应用推出了专用的开源模型与参考蓝图:
- Isaac GR00T N1.6:一款专为类人机器人打造的开源视觉-语言-行动(VLA)推理模型。它支持机器人的全身控制,并集成了英伟达Cosmos Reason模型,以实现更强大的推理能力与上下文理解能力。
- NVIDIA AI Blueprint for Video Search and Summarization:作为英伟达Metropolis平台的一部分,该蓝图提供了一套参考工作流,可用于构建视觉AI智能体。这些智能体能够分析大量的录播及直播视频,从而提升运营效率并保障公共安全。

据了解,Salesforce、Milestone、Hitachi、Uber、VAST Data、Encord等企业正采用Cosmos Reason模型,开发面向交通与职场生产力提升的AI智能体。Franka Robotics、Humanoid和NEURA Robotics则利用Isaac GR00T模型,在机器人大规模量产前,对其全新行为进行仿真、训练与验证。
针对医疗健康与生命科学的AI
NVIDIA Clara是专门针对医疗健康与生命科学领域的AI技术工具,核心目标是降低行业成本、加速治疗方案落地,打通数字科研与实际医疗应用之间的壁垒。
该系列中的多款专项模型各有侧重:
- La-Proteina 能设计原子级精度的大型蛋白质;
- ReaSyn v2 在药物发现阶段就开始考虑“如何生产”的问题;
- KERMT 可以预测潜在药物进入人体后的反应,提前排查安全问题;
- RNAPro 用来预测RNA分子复杂的3D结构,推进个性化医疗方案。

模型之外,英伟达还将为研究者提供包含45.5万个合成蛋白质结构的数据集。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/17056
