英伟达豪掷260亿美元进军开源大模型：从AI基础设施霸主到亲自下场淘金

2026年3月12日下午4:41 • AI产业动态 • 阅读 284

昨日，我们解读了英伟达CEO黄仁勋发表的长篇博客。他在文中指出，人工智能是当今塑造世界最强大的力量之一，它并非单一应用或模型，而是如同电力和互联网一般的关键基础设施。

他将人工智能基础设施划分为“五层蛋糕”：能源 → 芯片 → 基础设施 → 模型 → 应用。目前，英伟达自身已成为人工智能时代基础设施的核心部分，尤其在芯片及“AI工厂”类基础设施领域占据主导地位。

然而，英伟达的雄心显然不止于此，其触角正试图伸向“五层蛋糕”的每一层。2023年11月，英伟达推出首个Nemotron模型，标志着其正式进军通用大模型领域，并开始探索将CUDA生态与自研模型深度结合的路径。

Nemotron系列模型尝试了多种技术路线，包括多种混合架构模型，如Mamba-Transformer架构的Nemotron-H、Llama-Nemotron、Jet-Nemotron等，直至近期采用混合专家架构的Nemotron 3。

尽管英伟达在这些开源模型中不乏性能强大、甚至曾跻身第一梯队的作品，但外界普遍认为Nemotron系列仍带有浓厚的技术试验色彩。

不过，英伟达在开源模型研究上的投入是认真的。根据2025年的一份财务文件披露，英伟达计划在未来五年内投入260亿美元用于构建开源人工智能模型。这一此前未被报道的消息已得到《WIRED》杂志的证实及英伟达高管的确认。

英伟达豪掷260亿美元进军开源大模型：从AI基础设施霸主到亲自下场淘金

业界常将英伟达比作“淘金热中卖铲子”的聪明人。但这笔巨额投资预示着英伟达正经历一场战略蜕变。当“卖铲人”亲自下场“淘金”，其目的究竟是为了更好地“卖铲子”，还是意图彻底占据整片“金矿”？

本周三，英伟达发布了迄今为止性能最强的开源模型——Nemotron 3 Super。该模型拥有1280亿参数，在体量上已与OpenAI的最大版本GPT-OSS相当。英伟达宣称，该模型在多项基准测试中的表现均优于GPT-OSS及其他同类竞品。

“英伟达正以更严肃的态度对待开源模型的开发，并且正在取得实质性进展。”英伟达应用深度学习研究副总裁布莱恩・卡坦扎罗表示。

尽管如此，英伟达正式大举投入开源模型研发的动机，仍令外界感到些许费解。

英伟达豪掷260亿美元进军开源大模型：从AI基础设施霸主到亲自下场淘金

对此，英伟达企业级生成式AI软件副总裁卡里・布里斯基给出了解释。她表示，英伟达未来的AI模型不仅将助力公司改进芯片设计，还将用于提升其构建的超算级数据中心性能。“我们构建模型是为了突破系统的极限，这不仅是为了测试计算能力，还包括存储和网络等各个方面，并以此指导我们的硬件架构路线图规划。”

此外，另一个重要驱动力在于当前的前沿开源模型生态。目前，顶尖的开源模型力量大量集中在中国，包括DeepSeek、Qwen、月之暗面、智谱AI以及MiniMax等众多中国顶尖模型都选择了免费开放权重的策略。这使得全球许多初创公司和研究人员正基于这些中国模型进行开发。这或许是英伟达决心重金投入开放权重大模型研发的关键因素之一。

计算机科学家、致力于推动AI开放性的非营利组织Laude Institute负责人安迪・康温斯基评价道：“（英伟达）处于众多开源和闭源AI工作的最前沿，这是他们对于开放生态抱有坚定信念的一个空前强烈的信号。”

英伟达正从算力供应商向全栈AI巨头进行战略转型，其目标直指由OpenAI和DeepSeek等领衔的前沿模型领域。这种“以模型驱动硬件”的策略，旨在通过对底层芯片能力的极致优化，在全球AI基础设施的竞争中，进一步巩固其在AI算力领域的绝对优势与护城河。

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：https://www.itsolotime.com/archives/25433

英伟达豪掷260亿美元进军开源大模型：从AI基础设施霸主到亲自下场淘金

相关推荐

Google Gemini模型矩阵再添新军：Nano Banana 2 Flash与Gemini 3.0 Flash的战略布局与技术解析

PerturbDiff：AI预测抗癌新药效果，首次将细胞群体分布视为随机变量，刷新单细胞响应预测SOTA

美学驱动AI创作革命：Elser.AI如何重塑短剧产业生态

Attention机制暗藏偏置陷阱：上海大学团队提出去偏修正公式，提升多模态大模型剪枝效率

从零构建高级AI Agent：Python实战指南与架构设计解析