马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

全球首个GW级超算集群Colossus 2震撼上线

刚刚,全球首个GW级超算集群Colossus 2,正式投入运行

马斯克兴奋地宣布:

这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

有了这剂算力强心针,Grok的忠实拥趸已经开始畅想Grok 5的统治时代。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

但在全网狂欢的背后,一个严峻的隐忧正在浮现——2026年夏天,美国13个州的6700万居民,可能因数据中心激增的电力需求而面临停电风险

全球首个GW级训练集群

马斯克的执行力再次令人惊叹。不依赖亚马逊或微软,也未借助“星际之门”计划,他凭借一己之力在孟菲斯建起了一座功率达1GW的超算集群。

前一代超算集群Colossus 1从无到有仅用了122天,配备了约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。而在此基础上规模翻了好几倍、功率达到1GW的Colossus 2,其建设周期也仅用了不到一年。

1GW是什么概念?

一般来说,1GW可以为75万户家庭供电,相当于高峰时期的旧金山。一座核电站的功率也大约在1GW左右。

如果按马斯克所说,今年4月Colossus 2将升级至1.5GW,并最终达到2GW的总装机容量,其耗电量将与美国大多数主要城市的用电量相当。

按照规划,彻底完工后的Colossus 2将内置55.5万张GPU,规模远超Meta的15万、微软的10万以及谷歌的分布式基础设施。而这庞大的算力资源,将全部为Grok模型服务。

此前曾有爆料称,Grok 5的参数规模将达到惊人的6万亿左右,是Grok 4的两倍以上,其训练正是基于Colossus 2。当时就有观点预测,Grok 5将在拥有数十万张英伟达GPU的Colossus 2上训练,耗电量约为1GW。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

如今,Colossus 2已正式上线,1GW的算力条件恰好满足Grok 5的训练需求。随着xAI近期完成200亿美元的E轮融资,Grok 5的“规模扩展”筹码进一步增加,这意味着更大的模型参数、更快的训练与迭代速度。

当OpenAI还在为2027年的算力基础设施发愁时,xAI已经将一座“城市级”的AI工厂开机运行,将Grok 5提前推向了市场对下一代SOTA模型的期待中。

正如网友所说,AI时代,速度就是最强的护城河。

马斯克Colossus 2超算集群震撼上线:1GW算力创世界纪录,Grok 5训练加速,但电网危机隐现

电网危机隐现

然而,并非所有人都能因这种“速度”而受益。

据《华尔街日报》报道,美国非营利电网运营商PJM警告,未来可能在极端高温或严寒天气期间,对区域内的居民实施轮流断电。这意味着,美国13个州的6700万人,在今年夏天可能面临一个相当难熬的时期。

要理解这个问题,首先需要明白PJM的角色。PJM本质上是美国能源系统的交通指挥中心,它根据实时用电需求,协调发电厂何时增发、何时降载,以维持电网的供需平衡。

然而,大模型“大力出奇迹”的竞赛正在打破这种平衡。在数据中心建设热潮的推动下,PJM预计未来10年电力需求将以年均4.8%的速度增长。对于一个多年来需求变化不大的系统而言,这样的增速是罕见的。

一边是需求激增,另一边,电力供给的增长却相当缓慢。新建电厂的速度甚至跟不上老电厂的退役速度,电网容量正面临饱和。一旦供需出现偏差,电网频率就会波动,可能损坏发电厂等关键基础设施。

为避免系统性风险,PJM只能两害相权取其轻,选择在用电高峰期通过轮流停电来为电网卸压。

PJM并非没有尝试其他解决方案。去年9月,PJM曾提议数据中心在高峰时段主动降低用电量,或改从其他渠道获取电力支持。然而,亚马逊、谷歌、微软等科技巨头几乎都表示了反对,认为这是对数据中心行业的歧视

值得一提的是,PJM主要负责美国东海岸地区,而xAI的Colossus 2位于中南部,并不在PJM电网的直接覆盖范围内。同时,为减少对当地电网的冲击,xAI还部署了168个特斯拉Megapack电池储能系统,旨在用电高峰期提供电力缓冲,尽量避免周边居民遭遇停电。

参考链接:
[1]https://x.com/MilkRoadAI/status/2012558197240815665
[2]https://www.wsj.com/business/energy-oil/power-grid-ai-data-centers-1235f296


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/18375

(0)
上一篇 2026年1月18日 下午12:50
下一篇 2026年1月18日 下午1:08

相关推荐

  • AI抗体设计新纪元:Chai-2突破药物研发瓶颈,引领生物医药理性设计革命

    在人工智能技术日新月异的今天,当公众目光聚焦于Gemini等通用大模型的娱乐化应用时,一场更为深刻的技术革命正在生物医药领域悄然发生。Chai-2模型的突破性进展,标志着抗体药物研发正式迈入“计算优先”的新时代,其意义不亚于当年的AlphaFold对结构生物学的颠覆。 传统抗体药物研发面临的根本性挑战在于其高度依赖试错式实验筛选。科学家通常需要从数百甚至数千…

    2025年12月3日
    35300
  • SpaceX幕后操盘手格温·肖特韦尔:从拒绝马斯克到拯救火箭帝国的技术领袖

    鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 2026年全球资本市场的头号悬念,非SpaceX的“世纪IPO” 莫属。 SpaceX预计将在今年以1.5万亿美元的目标估值和超300亿美元的融资规模,正式向全球最大IPO纪录发起冲击。 然而这一次,马斯克不再是聚光灯下的全部焦点。 最近夺走他风头的是那位长期站在马斯克身后,SpaceX真正的操盘手——格…

    2026年1月24日
    30100
  • AI大模型周报:阿里、腾讯、Anthropic等巨头密集发布,多模态与推理能力成焦点

    10月13日 【开源】 阿里开源 Qwen3-VL-8B-Thinking 与 Qwen3-VL-8B-Instruct 模型。作为 Qwen3-VL 系列的 8B Dense 模型,它们显存占用更低,具备多模态理解与推理能力,支持长视频、长文档等超长上下文输入,并集成了视觉 2D/3D 定位、全面空间感知与万物识别功能。 10月14日 【闭源】 腾讯混元发…

    2025年10月20日
    30500
  • 【重磅爆料】AI 圈又要热闹了!多款大模型即将扎堆上线

    Claude 4.5与Gemini 3即将发布,但焦点在DeepSeek。其V3.2版本疑似官方预热,而十月将至的V4版本则被曝将实现1M上下文长度、GRPO Turbo多步思考及更高推理效率等重大升级。

    2025年10月1日
    67501
  • DSPy 3与GEPA:革新RAG框架的自动推理与提示进化技术

    近期,OpenAI 发布了 GPT-5.2 模型,引发了广泛关注。路透社报道称,OpenAI 在竞争压力下加速了研发进程。此次更新并非功能堆砌,而是聚焦于在智能、代码处理、长文本理解等核心能力上的显著提升,尤其擅长处理创建电子表格、制作演示文稿等复杂的多步骤任务。 简而言之,GPT-5.2 是一次面向实用场景的“精修”,在可靠性、长上下文处理、工具执行和输出…

    2026年1月20日
    31300