英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

北京时间今天凌晨两点,英伟达GTC大会在加州圣何塞正式召开。英伟达联合创始人兼CEO黄仁勋在主题演讲中表示:“我们重新定义了计算,就像个人电脑革命和互联网革命一样。我们现在正处于一个全新平台变革的开端。”

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

黄仁勋预测,全球公司在Blackwell和Rubin系统上的支出,将在2025年至2027年间达到1万亿美元,其中60%的业务将来自超大规模云计算。这一预测较其去年10月的预期(2026年底前达5000亿美元)直接翻倍。

驱动这一市场增长的核心原因在于AI发展到了“推理拐点”。如果说此前AI产业的重点是模型的“训练”,那么现在已全面进入“推理和生成”阶段。算力需求并非见顶,而是刚刚开始爆发。

新一代Vera Rubin量产:为智能体时代打造的算力引擎

今年的重磅产品并非单一芯片,而是一套庞大复杂的AI算力系统。黄仁勋表示,基于全新Vera Rubin架构的英伟达NVL72是一场“豪赌”,旨在应对AI推理任务中追求极致效率的最大挑战。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

NVL72架构实现了每瓦token性能50倍的提升,速度提升远超摩尔定律,堪称“token之王”。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

黄仁勋指出,数据中心正从存储文件的地方转变为生成token的工厂。推理是核心工作负载,而token则成为了新的数字商品。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

Vera Rubin NVL72被描述为“为智能体AI时代注入强大动力的引擎”。该系统包含七款全新芯片,旨在构建全球最大规模的AI工厂,针对从预训练、后训练到智能体推理的各个环节进行优化。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

Vera Rubin平台细节包括:
* Vera CPU
* Rubin GPU
* NVLink 6 交换机
* NVIDIA ConnectX 9 超级网卡
* BlueField4 DPU
* Spectrum-6 以太网交换机
* 新集成的 Groq 3 LPU

具体而言,Vera Rubin NVL72机架集成了72个Rubin GPU和36个Vera CPU,通过NVLink 6连接,并配备ConnectX-9 SuperNIC和BlueField-4 DPU。其实现了突破性效率:与NVIDIA Blackwell平台相比,仅需四分之一数量的GPU即可训练大型混合专家模型,每瓦推理吞吐量提高10倍,每token成本降至十分之一。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

NVL72专为超大规模AI工厂设计,可与Quantum-X800 InfiniBand和Spectrum-X以太网无缝扩展,从而在大规模GPU集群中保持高利用率,同时缩短训练时间并降低总体拥有成本。

更大规模:Vera Rubin Ultra NVL576

还有规模更为庞大的系统——“NVIDIA Vera Rubin Ultra NVL576”。它引入了一种全新的双层全互连NVLink拓扑结构,使系统可纵向扩展至最多576块GPU。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

Vera Rubin Ultra NVL576将8个独立的MGX NVL机架(每个配备72块Rubin Ultra GPU)连接在一起,通过铜缆互连和直连光互连组成一个统一的576 GPU NVLink域。该系统基于MGX机架级生态构建,旨在实现快速量产落地。

为验证此大规模跨机架NVLink拓扑,英伟达内部构建了一套基于GB200的原型系统“Polyphe”。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

此外,英伟达正将算力部署延伸至太空。黄仁勋宣布,公司正在研发名为“Nvidia Vera Rubin Space-1”的用于轨道数据中心的新型芯片/计算机,以解决太空环境中的独特冷却等工程挑战。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

英伟达表示,Vera Rubin架构的落地速度显著加快,目前已在微软Azure上开始部署。随着Vera Rubin推出,AI智能体的转折点已经到来,史上规模最大的AI基础设施建设即将展开。

全新AI推理芯片:LPU

Vera Rubin的强大能力,离不开LPU的协同。LPU专为优化推理流水线设计,与GPU协同可突破纯GPU服务器在低延迟推理、token解码效率和能耗上的瓶颈。

本次GTC大会发布的NVIDIA Groq 3 LPX,标志着加速计算领域的一项重要里程碑。它旨在解决大模型推理中低延迟与高吞吐量难以兼得的核心矛盾。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

LPX架构与Vera Rubin GPU协同工作,针对智能体系统所需的低延迟与超长上下文推理进行优化。在此架构下,每兆瓦推理吞吐量最高可提升35倍,并为万亿参数模型带来最高10倍的营收潜力。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

LPX机架采用全液冷设计,基于MGX基础设施构建,可无缝集成到下一代Vera Rubin AI工厂中。单个机架包含256个LPU处理器,提供128GB片上SRAM和640 TB/s的纵向互联带宽。大规模部署时,大量LPU可协同工作,如同一个巨型单一处理器,实现高速、确定性的推理加速。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

当与Vera Rubin NVL72系统协同部署时,Rubin GPU与LPU共同计算AI模型每一层的每个输出token,从而显著提升解码性能。LPX架构针对万亿参数模型与百万token上下文进行了优化,通过与Vera Rubin的协同设计,在功耗、内存与计算效率之间实现最佳平衡。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

目前,LPU由三星代工生产,未来新一代产品可能转由台积电代工。此外,未来的GPU(Feynman架构)也可能集成Groq处理器,这有望在提升性能的同时降低成本。

Nvidia Groq 3 LPX预计将在今年下半年正式推出。

NemoClaw:英伟达版 OpenClaw 上线

近期备受关注的OpenClaw在GTC大会上被黄仁勋比作“操作系统”。它是一个可以连接云系统的智能体平台,能够生成其他智能体、进行任务调度与问题分解等。

然而,当前基于OpenClaw的AI智能体在与外部系统通信时存在安全隐患。英伟达推出的NemoClaw则提供了企业级的安全保障,有助于保护敏感信息。

英伟达在OpenClaw创始人构建的基础架构之上,增加了多层安全防护,将其定位为企业级安全解决方案。黄仁勋表示,英伟达召集了全球顶尖的安全研究人员,对OpenClaw进行了修改,使其能够安全地部署在企业内部环境。

他强调,如今每家企业都需要制定自己的OpenClaw战略。在黄仁勋看来,OpenClaw以及更广义的Claw系统,其未来的重要性将与Linux、Kubernetes、HTML等基础软件设施相当。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

在技术层面,NemoClaw是一套让OpenClaw更易于部署、安全运行的基础软件工具。通过NVIDIA Agent Toolkit,用户只需一条命令即可完成OpenClaw的安装与优化,并自动部署OpenShell运行时。

该运行时提供开源模型支持和隔离的沙箱环境,确保AI智能体在执行任务、调用工具或访问外部网络时,始终受到安全、网络和隐私策略的约束。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

NemoClaw同时支持多种编程智能体。在开放智能体模式下,它可以调用运行在用户本地专用系统上的开源模型(包括NVIDIA Nemotron);同时通过隐私路由,智能体也能安全访问运行在云端的前沿模型。

本地模型与云端模型的结合,为智能体的持续学习与能力扩展奠定了基础,使其能在既定的隐私与安全规则下完成更复杂的任务。

黄仁勋还提到,与OpenClaw搭配部署的最佳模型之一,是英伟达近期发布的Nemotron 3 Super。这是一款面向智能体场景的开源大语言模型。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

Nemotron 3 Super专门针对长上下文任务进行了优化,参数规模控制在1200亿。结合NemoClaw提供的安全层以及模型自身的隐私优势,英伟达基本解决了在边缘部署智能体时最关键的隐私限制问题。

此外,NemoClaw还能调用英伟达生态中的多种开源工具和框架,如cuDF、Nemotron Dynamo、cuOPT等库。这些组件为智能体提供了更强大的能力,使其在处理数据、优化决策和执行复杂任务时更加高效。

开发者即日起可通过以下链接访问英伟达的Agent Toolkit和OpenShell,也可将OpenShell与LangChain结合使用,或直接从GitHub下载并在本地运行。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

链接地址:https://build.nvidia.com/

企业用户则可以通过AWS、Google Cloud、Microsoft Azure等云服务平台创建并部署AI智能体。

AI 进入物理世界

除了数字世界的智能体,AI也正在物理世界中大规模落地。

英伟达在GTC大会上展示了110台机器人,并宣布比亚迪、现代、日产和吉利成为其最新合作伙伴。这些车企将采用NVIDIA DRIVE Hyperion技术打造L4级自动驾驶汽车。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

随着越来越多汽车制造商平台的支持,英伟达与Uber计划在2028年前,在四大洲的28个城市推出完全由NVIDIA DRIVE AV全栈软件驱动的自动驾驶车队。预计到2027年上半年,Uber的自动驾驶服务将率先在洛杉矶和旧金山湾区推出。这支由DRIVE Hyperion提供支持的车队将利用NVIDIA Alpamayo开放模型和NVIDIA Halos操作系统。

在GTC大会上,英伟达宣布与众多机器人厂商合作,共同推动生产规模的物理AI发展。英伟达发布了全新的NVIDIA Isaac仿真框架,以及面向业界的Cosmos、Isaac GR00T开放模型,用于开发、训练和部署下一代智能机器人。

开放式物理AI数据工厂Blueprint,旨在对视觉AI智能体、机器人和自动驾驶车辆的物理AI模型进行大规模数据处理、合成数据生成、强化学习与评估。

Keynote最后登场的是在虚拟世界中训练、最终获得物理躯体的“雪宝”机器人,它完全由英伟达物理AI全家桶构建而成。或许不久之后,我们就能在迪士尼乐园里见到它。

英伟达发布Vera Rubin NVL72:AI推理拐点已至,算力市场将达万亿美元

AI的下半场才刚刚开始。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/26061

(0)
上一篇 16小时前
下一篇 16小时前

相关推荐

  • Grok大规模信息失真事件:生成式AI的实时幻觉危机与后真相时代的算法困境

    近日,马斯克旗下xAI开发的聊天机器人Grok在悉尼邦迪海滩枪击案等重大公共事件中出现了系统性信息失真现象,引发了业界对生成式AI实时处理能力的深度担忧。这并非简单的技术故障,而是暴露了当前大语言模型在应对突发新闻、实时数据流时存在的结构性缺陷——即“幻觉”问题在高速信息环境下的放大效应。 事件始于悉尼邦迪海滩发生的一起枪击惨案,现场视频显示43岁的路人艾哈…

    2025年12月15日
    26400
  • 谷歌DeepMind掌门人揭示AGI路线图:2030年前需1-2个Transformer级突破,Titans架构或成关键

    在人工智能发展的关键节点,谷歌DeepMind首席执行官Demis Hassabis近期对未来技术趋势做出了系统性预测,为行业提供了清晰的路线图。这些预测不仅基于当前技术进展,更反映了全球顶尖研究机构对通用人工智能(AGI)实现路径的深刻思考。 Hassabis提出的五大核心趋势构成了未来AI发展的基本框架。首先是多模态融合的彻底打通,这意味着文本、图像、音…

    2025年12月7日
    26500
  • LLM重构数据准备:从规则驱动到语义驱动的范式革命

    在企业级系统中,数据团队普遍面临一个困境:模型迭代飞速,但数据准备的「老旧管道」却愈发沉重。清洗、对齐、标注……这些工作依然深陷于人工规则与专家经验的泥潭。 数据格式五花八门:正则表达式越写越多,却总有意想不到的「脏数据」出现。 跨系统表结构不一致:对齐逻辑复杂,人工映射耗时耗力。 海量数据缺少标签和语义描述:分析师「看不懂、用不好」。 这背后是数据准备这一…

    2026年2月8日
    9700
  • UNCOMP:从矩阵熵悖论到KV Cache优化——揭秘大模型深层稀疏性的理论突破与实践创新

    大语言模型(LLM)中的结构化稀疏性现象,尤其是模型深度与稀疏性增强的正相关性,以及“检索头”和“检索层”的涌现机制,长期以来缺乏统一的理论解释。这些现象不仅关乎模型效率,更触及LLM内部信息处理的核心逻辑。我们荣幸地宣布,论文《UNComp: Can Matrix Entropy Uncover Sparsity? — A Compressor…

    2025年11月13日
    16100
  • 20亿融资!灵初智能All in人类原生数据,破解具身智能数据困局

    具身智能的竞争焦点,或许并不在于机器人硬件本身。 这一认知差异,正被敏锐的资本迅速转化为投资行动。 近日,灵初智能宣布完成总额约 20亿元 的 天使轮及Pre-A轮融资。 天使轮 由国开金融、国中资本、央视融媒体产业投资基金等国家级资本,某数千亿上市公司旗下战投、长飞光纤旗下基金等产业龙头资本,以及元生创投、珠海科技产业集团、钧山投资等多家知名基金共同投资。…

    6天前
    17900