马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

全球首个GW级超算集群Colossus 2震撼上线

刚刚,全球首个GW级超算集群Colossus 2,正式投入运行

马斯克兴奋地宣布:

这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

有了这剂算力强心针,Grok的忠实拥趸已经开始畅想Grok 5的统治时代。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

但在全网狂欢的背后,一个严峻的隐忧正在浮现——2026年夏天,美国13个州的6700万居民,可能因数据中心激增的电力需求而面临停电风险

全球首个GW级训练集群

马斯克的执行力再次令人惊叹。不依赖亚马逊或微软,也未借助“星际之门”计划,他凭借一己之力在孟菲斯建起了一座功率达1GW的超算集群。

前一代超算集群Colossus 1从无到有仅用了122天,配备了约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。而在此基础上规模翻了好几倍、功率达到1GW的Colossus 2,其建设周期也仅用了不到一年。

1GW是什么概念?

一般来说,1GW可以为75万户家庭供电,相当于高峰时期的旧金山。一座核电站的功率也大约在1GW左右。

如果按马斯克所说,今年4月Colossus 2将升级至1.5GW,并最终达到2GW的总装机容量,其耗电量将与美国大多数主要城市的用电量相当。

按照规划,彻底完工后的Colossus 2将内置55.5万张GPU,规模远超Meta的15万、微软的10万以及谷歌的分布式基础设施。而这庞大的算力资源,将全部为Grok模型服务。

此前曾有爆料称,Grok 5的参数规模将达到惊人的6万亿左右,是Grok 4的两倍以上,其训练正是基于Colossus 2。当时就有观点预测,Grok 5将在拥有数十万张英伟达GPU的Colossus 2上训练,耗电量约为1GW。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

如今,Colossus 2已正式上线,1GW的算力条件恰好满足Grok 5的训练需求。随着xAI近期完成200亿美元的E轮融资,Grok 5的“规模扩展”筹码进一步增加,这意味着更大的模型参数、更快的训练与迭代速度。

当OpenAI还在为2027年的算力基础设施发愁时,xAI已经将一座“城市级”的AI工厂开机运行,将Grok 5提前推向了市场对下一代SOTA模型的期待中。

正如网友所说,AI时代,速度就是最强的护城河。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

电网危机隐现

然而,并非所有人都能因这种“速度”而受益。

据《华尔街日报》报道,美国非营利电网运营商PJM警告,未来可能在极端高温或严寒天气期间,对区域内的居民实施轮流断电。这意味着,美国13个州的6700万人,在今年夏天可能面临一个相当难熬的时期。

要理解这个问题,首先需要明白PJM的角色。PJM本质上是美国能源系统的交通指挥中心,它根据实时用电需求,协调发电厂何时增发、何时降载,以维持电网的供需平衡。

然而,大模型“大力出奇迹”的竞赛正在打破这种平衡。在数据中心建设热潮的推动下,PJM预计未来10年电力需求将以年均4.8%的速度增长。对于一个多年来需求变化不大的系统而言,这样的增速是罕见的。

一边是需求激增,另一边,电力供给的增长却相当缓慢。新建电厂的速度甚至跟不上老电厂的退役速度,电网容量正面临饱和。一旦供需出现偏差,电网频率就会波动,可能损坏发电厂等关键基础设施。

为避免系统性风险,PJM只能两害相权取其轻,选择在用电高峰期通过轮流停电来为电网卸压。

PJM并非没有尝试其他解决方案。去年9月,PJM曾提议数据中心在高峰时段主动降低用电量,或改从其他渠道获取电力支持。然而,亚马逊、谷歌、微软等科技巨头几乎都表示了反对,认为这是对数据中心行业的歧视

值得一提的是,PJM主要负责美国东海岸地区,而xAI的Colossus 2位于中南部,并不在PJM电网的直接覆盖范围内。同时,为减少对当地电网的冲击,xAI还部署了168个特斯拉Megapack电池储能系统,旨在用电高峰期提供电力缓冲,尽量避免周边居民遭遇停电。

参考链接:
[1]https://x.com/MilkRoadAI/status/2012558197240815665
[2]https://www.wsj.com/business/energy-oil/power-grid-ai-data-centers-1235f296


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/18375

(0)
上一篇 2026年1月18日 下午12:50
下一篇 2026年1月18日 下午1:08

相关推荐

  • 对话九合王啸:90%具身智能公司没未来,市场名额只有三五家

    2026年初,具身智能赛道再度涌入大量资本。 在喧嚣的资本浪潮中,能够做出专业判断、锚定长期趋势的投资人屈指可数,王啸是其中之一。 在人工智能尚未成为风口的十余年前,他便带领九合创投布局AI相关领域。当大模型底层框架还未成为行业焦点时,他投资了一流科技,其研发的OneFlow后来成为世界首个面向大模型大数据的人工智能计算框架。在具身智能仍是创投圈小众话题时,…

    2026年3月1日
    12600
  • 智谱华章登陆港交所:全球大模型第一股,市值528亿港元开启AGI新纪元

    「全球大模型第一股」来了! 2026年1月8日,北京智谱华章科技股份有限公司(02513.HK)正式在香港联合交易所挂牌上市。 至此,全球首家以通用人工智能(AGI)基座模型为核心业务的上市公司花落中国。 智谱首日开盘价120港元/股,市值528.28亿港元。 在本次IPO发行中,智谱香港公开发售获1159.46倍认购,国际发售获15.28倍认购。以每股11…

    2026年1月8日
    23000
  • 吴恩达深度解析:Agent落地最大瓶颈非技术,人才储备成决胜关键

    如果说两年前AI圈的主旋律是LLMs(大语言模型),那今年Agent无疑成为了最吸睛的技术方向。不过,当概念定义混乱、技术路径尚未成体系的当下,真正能讲清Agentic AI究竟是什么、会带来什么影响的人并不多。 最近,吴恩达在接受硅谷投资人Elad Gil与Sarah Guo的访谈时,深入探讨了智能体AI的崛起及其对行业的深远影响。这位AI领域的资深专家不…

    2025年10月29日
    17300
  • 多模态大模型后训练范式革新:中兴通讯团队验证GRPO-only路径,突破样本难度量化与训练协同瓶颈

    在人工智能技术快速迭代的浪潮中,多模态大模型已成为连接视觉与语言智能的核心枢纽。然而,其后训练阶段长期面临两大关键挑战:缺乏可量化的样本难度评估体系,以及传统训练范式难以协同优化感知与推理能力。近期,由中南大学与中兴通讯AIM团队联合完成的研究,通过系统性实验设计,不仅为多模态后训练提供了创新的难度采样标准,更首次验证了仅依赖强化学习(GRPO)独立优化多模…

    2025年11月28日
    17100
  • RaaS崛起:AI Agent作为“硅基员工”如何颠覆传统SaaS定价模式

    “硅基员工”上岗!百融云创提出RaaS新范式,引爆海内外技术圈。 1月19日早盘,软件股集体下挫。税务软件巨头Intuit大跌16%,绘图与CRM双龙头Adobe与Salesforce均跌超11%,摩根士丹利追踪的SaaS(软件即服务)指数今年已跌15%,创下2022年以来最差开局。 在美资本市场的抛售潮,能够看出SaaS模式的增长焦虑。SaaS主导美国企业…

    2026年1月23日
    31600