AI基础设施

  • AI Ping:清华系AI Infra重塑大模型API服务秩序,评测路由双机制破解黑盒焦虑

    中国版 OpenRouter + Artificial Analysis,让每一枚 Token 都能流向它最该去的地方。 大模型 API 服务的「黑盒」焦虑 Clawdbot 的病毒式裂变,仿佛是一年前 Manus 的魅影重现。同样一夜之间站上风口,同样点燃了无数开发者对「泼天富贵」的想象,也顺手把 Token 烧成了新的「硬通货」。 一组数据更具体地揭示了…

    2026年2月2日
    64700
  • AI Ping:大模型API的智能导航与评测平台,终结选型混沌时代

    衡宇 发自 凹非寺 比面对大模型黑盒更让人抓瞎的事情,就是要去选既靠谱、性价比又高的API服务。 这几乎是每一个涉足AI应用开发的团队都会经历的至暗时刻。 同一个模型架构在不同的供应商手里,不仅价格上有出入,延迟、稳定性、吞吐量等用户关心的指标,波动幅度巨大。 在API调用动辄几十万、上百万token的时代,API选型居然变成了一件靠经验反复试错的事儿。 这…

    2026年2月2日
    55100
  • Meta AI基础设施十年演进:从GPU集群到自研芯片的下一代蓝图

    关键词:基础设施演进、AI集群、大语言模型、GPU扩展、自研芯片 我们仍处于人工智能工作负载演进和应用的早期阶段。过去几年我们一直忙碌不停,而未来几年的发展速度将更快。人工智能对硬件提出的需求,丝毫没有放缓的迹象。 在过去的21年里,Meta实现了指数级增长,从一个连接美国几所大学数千人的小型社交网络,发展成为拥有多款应用程序和新型硬件产品、服务全球超过34…

    2026年1月30日
    62800
  • 黄仁勋达沃斯宣言:数万亿美元AI基建浪潮开启,英伟达千亿投入仅是序章

    当地时间1月21日,英伟达CEO黄仁勋在达沃斯世界经济论坛上与贝莱德CEO拉里·芬克展开对话。黄仁勋的核心观点极为明确:当前最重要的事情,除了基础设施(Infra),还是基础设施。 黄仁勋指出,人工智能已经启动了“人类历史上最大规模的基础设施建设”。英伟达虽已投入数千亿美元,但未来仍需建设数万亿美元级别的基础设施。他进一步阐述,AI本身未来将成为每个国家的基…

    2026年1月22日
    40200
  • 谷歌母公司330亿收购AI算力基建商Intersect,押注数据中心能源革命

    谷歌母公司Alphabet 330亿收购AI算力基建商Intersect,押注数据中心能源革命 智东西12月23日消息,谷歌母公司Alphabet宣布将以47.5亿美元(约合人民币333.85亿元)现金收购美国数据中心和能源基础设施公司Intersect,并承担相关债务。该收购计划于2026年上半年完成。 ▲Alphabet官宣公告(图源:Alphabet)…

    2025年12月24日
    38500
  • 摩尔线程MUSA 5.0发布:国产全功能GPU架构花港亮相,算力密度提升50%,能效提升10倍

    上市仅15天后,摩尔线程便将首个大动作直接指向了生态的核心——开发者。 在首届、也是国内首个聚焦全功能GPU的开发者大会上,围绕MUSA这一关键词,新品密集发布: 一个全新GPU架构:花港,算力密度提升50%,能效提升10倍。 三款新芯片:华山、庐山、长江,分别聚焦AI训推一体、图形渲染和智能SoC。 一个智算集群:夸娥万卡集群(KUAE2.0),定位国产自…

    2025年12月21日
    78500
  • 亚马逊云科技re:Invent 2025:AI算力帝国与开放模型生态的双重进化

    在拉斯维加斯举行的re:Invent 2025大会上,亚马逊云科技CEO Matt Garman以惊人的效率展示了公司在AI基础设施领域的全面布局。这场发布会的核心价值不仅体现在数量惊人的新品发布,更在于其系统性地构建了从底层算力到上层应用的完整AI技术栈。本文将从算力架构革新、模型生态战略、产业应用落地三个维度,深入剖析亚马逊云科技如何重新定义企业AI部署…

    2025年12月3日
    33900
  • Transformers v5.0.0rc0发布:AI基础设施的范式重构与生态演进

    近日,Hugging Face正式发布了Transformers库的v5.0.0rc0候选版本,标志着这一全球最流行的AI基础设施库完成了从v4到v5长达五年的技术周期跨越。作为AI开源生态系统的核心支柱,Transformers的这次重大更新不仅体现了技术架构的深度重构,更预示着AI开发范式的系统性演进。 自2020年11月v4版本发布以来,Transfo…

    2025年12月2日
    36100
  • 华为Flex:ai开源:异构算力池化技术如何重塑AI资源利用效率

    在AI产业高速发展的浪潮中,算力已成为驱动创新的核心燃料。然而,全球范围内普遍存在的算力资源利用率低下问题,正成为制约AI规模化应用的关键瓶颈。小模型任务独占整卡导致资源闲置,大模型任务单机算力不足难以支撑,大量缺乏GPU/NPU的通用服务器处于算力“休眠”状态——这种供需错配造成了严重的资源浪费。2023年11月21日,华为正式发布并开源AI容器技术Fle…

    2025年11月22日
    44200
  • 开源欧拉发布全球首个超节点操作系统:开启AI时代操作系统新纪元

    在人工智能浪潮席卷全球的当下,操作系统作为连接硬件与应用的核心基石,正迎来前所未有的变革机遇。2025年,以“智跃无界,开源致远”为主题的操作系统大会在北京中关村国际创新中心成功举办,标志着开源欧拉(openEuler)社区正式迈入面向超节点和AI时代的新发展阶段。 开源欧拉社区自成立以来,在开放原子开源基金会的运营孵化下,已发展成为全球最活跃的开源操作系统…

    2025年11月15日
    34700