英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

北京时间今天凌晨两点，英伟达GTC大会在加州圣何塞正式召开。英伟达联合创始人兼CEO黄仁勋在主题演讲中表示：“我们重新定义了计算，就像个人电脑革命和互联网革命一样。我们现在正处于一个全新平台变革的开端。”

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

黄仁勋预测，全球公司在Blackwell和Rubin系统上的支出，将在2025年至2027年间达到1万亿美元，其中60%的业务将来自超大规模云计算。这一预测较其去年10月的预期（2026年底前达5000亿美元）直接翻倍。

驱动这一市场增长的核心原因在于AI发展到了“推理拐点”。如果说此前AI产业的重点是模型的“训练”，那么现在已全面进入“推理和生成”阶段。算力需求并非见顶，而是刚刚开始爆发。

新一代Vera Rubin量产：为智能体时代打造的算力引擎

今年的重磅产品并非单一芯片，而是一套庞大复杂的AI算力系统。黄仁勋表示，基于全新Vera Rubin架构的英伟达NVL72是一场“豪赌”，旨在应对AI推理任务中追求极致效率的最大挑战。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

NVL72架构实现了每瓦token性能50倍的提升，速度提升远超摩尔定律，堪称“token之王”。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

黄仁勋指出，数据中心正从存储文件的地方转变为生成token的工厂。推理是核心工作负载，而token则成为了新的数字商品。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

Vera Rubin NVL72被描述为“为智能体AI时代注入强大动力的引擎”。该系统包含七款全新芯片，旨在构建全球最大规模的AI工厂，针对从预训练、后训练到智能体推理的各个环节进行优化。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

Vera Rubin平台细节包括：
* Vera CPU
* Rubin GPU
* NVLink 6 交换机
* NVIDIA ConnectX 9 超级网卡
* BlueField4 DPU
* Spectrum-6 以太网交换机
* 新集成的 Groq 3 LPU

具体而言，Vera Rubin NVL72机架集成了72个Rubin GPU和36个Vera CPU，通过NVLink 6连接，并配备ConnectX-9 SuperNIC和BlueField-4 DPU。其实现了突破性效率：与NVIDIA Blackwell平台相比，仅需四分之一数量的GPU即可训练大型混合专家模型，每瓦推理吞吐量提高10倍，每token成本降至十分之一。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

NVL72专为超大规模AI工厂设计，可与Quantum-X800 InfiniBand和Spectrum-X以太网无缝扩展，从而在大规模GPU集群中保持高利用率，同时缩短训练时间并降低总体拥有成本。

更大规模：Vera Rubin Ultra NVL576

还有规模更为庞大的系统——“NVIDIA Vera Rubin Ultra NVL576”。它引入了一种全新的双层全互连NVLink拓扑结构，使系统可纵向扩展至最多576块GPU。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

Vera Rubin Ultra NVL576将8个独立的MGX NVL机架（每个配备72块Rubin Ultra GPU）连接在一起，通过铜缆互连和直连光互连组成一个统一的576 GPU NVLink域。该系统基于MGX机架级生态构建，旨在实现快速量产落地。

为验证此大规模跨机架NVLink拓扑，英伟达内部构建了一套基于GB200的原型系统“Polyphe”。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

此外，英伟达正将算力部署延伸至太空。黄仁勋宣布，公司正在研发名为“Nvidia Vera Rubin Space-1”的用于轨道数据中心的新型芯片/计算机，以解决太空环境中的独特冷却等工程挑战。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

英伟达表示，Vera Rubin架构的落地速度显著加快，目前已在微软Azure上开始部署。随着Vera Rubin推出，AI智能体的转折点已经到来，史上规模最大的AI基础设施建设即将展开。

全新AI推理芯片：LPU

Vera Rubin的强大能力，离不开LPU的协同。LPU专为优化推理流水线设计，与GPU协同可突破纯GPU服务器在低延迟推理、token解码效率和能耗上的瓶颈。

本次GTC大会发布的NVIDIA Groq 3 LPX，标志着加速计算领域的一项重要里程碑。它旨在解决大模型推理中低延迟与高吞吐量难以兼得的核心矛盾。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

LPX架构与Vera Rubin GPU协同工作，针对智能体系统所需的低延迟与超长上下文推理进行优化。在此架构下，每兆瓦推理吞吐量最高可提升35倍，并为万亿参数模型带来最高10倍的营收潜力。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

LPX机架采用全液冷设计，基于MGX基础设施构建，可无缝集成到下一代Vera Rubin AI工厂中。单个机架包含256个LPU处理器，提供128GB片上SRAM和640 TB/s的纵向互联带宽。大规模部署时，大量LPU可协同工作，如同一个巨型单一处理器，实现高速、确定性的推理加速。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

当与Vera Rubin NVL72系统协同部署时，Rubin GPU与LPU共同计算AI模型每一层的每个输出token，从而显著提升解码性能。LPX架构针对万亿参数模型与百万token上下文进行了优化，通过与Vera Rubin的协同设计，在功耗、内存与计算效率之间实现最佳平衡。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

目前，LPU由三星代工生产，未来新一代产品可能转由台积电代工。此外，未来的GPU（Feynman架构）也可能集成Groq处理器，这有望在提升性能的同时降低成本。

Nvidia Groq 3 LPX预计将在今年下半年正式推出。

NemoClaw：英伟达版 OpenClaw 上线

近期备受关注的OpenClaw在GTC大会上被黄仁勋比作“操作系统”。它是一个可以连接云系统的智能体平台，能够生成其他智能体、进行任务调度与问题分解等。

然而，当前基于OpenClaw的AI智能体在与外部系统通信时存在安全隐患。英伟达推出的NemoClaw则提供了企业级的安全保障，有助于保护敏感信息。

英伟达在OpenClaw创始人构建的基础架构之上，增加了多层安全防护，将其定位为企业级安全解决方案。黄仁勋表示，英伟达召集了全球顶尖的安全研究人员，对OpenClaw进行了修改，使其能够安全地部署在企业内部环境。

他强调，如今每家企业都需要制定自己的OpenClaw战略。在黄仁勋看来，OpenClaw以及更广义的Claw系统，其未来的重要性将与Linux、Kubernetes、HTML等基础软件设施相当。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

在技术层面，NemoClaw是一套让OpenClaw更易于部署、安全运行的基础软件工具。通过NVIDIA Agent Toolkit，用户只需一条命令即可完成OpenClaw的安装与优化，并自动部署OpenShell运行时。

该运行时提供开源模型支持和隔离的沙箱环境，确保AI智能体在执行任务、调用工具或访问外部网络时，始终受到安全、网络和隐私策略的约束。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

NemoClaw同时支持多种编程智能体。在开放智能体模式下，它可以调用运行在用户本地专用系统上的开源模型（包括NVIDIA Nemotron）；同时通过隐私路由，智能体也能安全访问运行在云端的前沿模型。

本地模型与云端模型的结合，为智能体的持续学习与能力扩展奠定了基础，使其能在既定的隐私与安全规则下完成更复杂的任务。

黄仁勋还提到，与OpenClaw搭配部署的最佳模型之一，是英伟达近期发布的Nemotron 3 Super。这是一款面向智能体场景的开源大语言模型。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

Nemotron 3 Super专门针对长上下文任务进行了优化，参数规模控制在1200亿。结合NemoClaw提供的安全层以及模型自身的隐私优势，英伟达基本解决了在边缘部署智能体时最关键的隐私限制问题。

此外，NemoClaw还能调用英伟达生态中的多种开源工具和框架，如cuDF、Nemotron Dynamo、cuOPT等库。这些组件为智能体提供了更强大的能力，使其在处理数据、优化决策和执行复杂任务时更加高效。

开发者即日起可通过以下链接访问英伟达的Agent Toolkit和OpenShell，也可将OpenShell与LangChain结合使用，或直接从GitHub下载并在本地运行。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

链接地址：https://build.nvidia.com/

企业用户则可以通过AWS、Google Cloud、Microsoft Azure等云服务平台创建并部署AI智能体。

AI 进入物理世界

除了数字世界的智能体，AI也正在物理世界中大规模落地。

英伟达在GTC大会上展示了110台机器人，并宣布比亚迪、现代、日产和吉利成为其最新合作伙伴。这些车企将采用NVIDIA DRIVE Hyperion技术打造L4级自动驾驶汽车。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

随着越来越多汽车制造商平台的支持，英伟达与Uber计划在2028年前，在四大洲的28个城市推出完全由NVIDIA DRIVE AV全栈软件驱动的自动驾驶车队。预计到2027年上半年，Uber的自动驾驶服务将率先在洛杉矶和旧金山湾区推出。这支由DRIVE Hyperion提供支持的车队将利用NVIDIA Alpamayo开放模型和NVIDIA Halos操作系统。

在GTC大会上，英伟达宣布与众多机器人厂商合作，共同推动生产规模的物理AI发展。英伟达发布了全新的NVIDIA Isaac仿真框架，以及面向业界的Cosmos、Isaac GR00T开放模型，用于开发、训练和部署下一代智能机器人。

开放式物理AI数据工厂Blueprint，旨在对视觉AI智能体、机器人和自动驾驶车辆的物理AI模型进行大规模数据处理、合成数据生成、强化学习与评估。

Keynote最后登场的是在虚拟世界中训练、最终获得物理躯体的“雪宝”机器人，它完全由英伟达物理AI全家桶构建而成。或许不久之后，我们就能在迪士尼乐园里见到它。

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

AI的下半场才刚刚开始。

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/26061

英伟达发布Vera Rubin NVL72：AI推理拐点已至，算力市场将达万亿美元

新一代Vera Rubin量产：为智能体时代打造的算力引擎

更大规模：Vera Rubin Ultra NVL576

全新AI推理芯片：LPU

NemoClaw：英伟达版 OpenClaw 上线

AI 进入物理世界

相关推荐

Grok大规模信息失真事件：生成式AI的实时幻觉危机与后真相时代的算法困境

谷歌DeepMind掌门人揭示AGI路线图：2030年前需1-2个Transformer级突破，Titans架构或成关键

LLM重构数据准备：从规则驱动到语义驱动的范式革命

UNCOMP：从矩阵熵悖论到KV Cache优化——揭秘大模型深层稀疏性的理论突破与实践创新

20亿融资！灵初智能All in人类原生数据，破解具身智能数据困局