国产GPU生死线:从财报看技术内卷下的商业闭环真相

关键词国产GPUCUDA兼容财务风险生态依附内卷竞争

对于深耕于深度学习框架底层、CUDA算子优化与芯片微架构设计一线的开发者而言,评估一家国产GPU公司,往往习惯于紧盯其宣称的算力峰值、显存带宽或对Triton/vLLM等新兴框架的支持度。

然而,商业世界的运行逻辑并非如此。在“百模大战”与Scaling Law主导的算力狂飙时代,纯粹的技术指标(尤其是宣传材料中的峰值性能)极具迷惑性

产品技术再先进,若无法获得市场订单、形成销售,便不具备自我造血能力——而没有造血能力的企业,终将难以为继。这是商业世界最朴素的真理,也是国产GPU行业正在经历的残酷现实。

在这个商业闭环中,产品架构与技术选型固然重要。但试想:若未来技术门槛持续降低,那么单纯的技术能力将不再是最高壁垒,更何况当前国产GPU都必须直面CUDA生态的兼容性挑战。真正决定企业生死的,是能否构建完整的商业闭环——获取真实订单,以用户反馈驱动产品迭代,形成自我增强的增长飞轮。没有订单,再精妙的架构也只是停留在纸面。

要判断一条技术路线能否持久、一套软件栈是否值得长期投入,最诚实的试金石只有两个:财务报表与实际出货量

下文的分析将基于摩尔线程、壁仞科技、天数智芯和沐曦集成电路四家公司披露的年度财务报告或业绩预告。

国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相

在具体拆解四家头部国产GPU公司(沐曦、摩尔线程、天数智芯、壁仞科技)的2025年财报之前,我们首先为技术从业者厘清几个关键的“技术-财务”映射关系:

  1. 营业收入 = 真实落地规模
    在算力市场,约10亿元人民币的营收大致对应数千张高端加速卡的实际交付。若未达到此量级,所谓“千卡/万卡集群稳定运行”的宣称,很可能仅是实验室内的演示场景。

  2. 研发费用 = 架构迭代与流片续航力
    一颗采用7nm/5nm先进制程的大芯片,单次流片成本高达数千万至上亿元人民币。叠加数百人的芯片设计与底层软件团队,年度的硬性研发投入通常需8-10亿元。低于此阈值,往往意味着芯片架构演进与底层软件维护可能面临停滞风险。

  3. 毛利率 = 产品生态溢价与市场议价权
    其计算公式为 (营业收入 - 营业成本) / 营业收入。如果毛利率长期处于极低水平,表明产品可能仅能依靠价格竞争,而无法通过CUDA兼容性、软件栈易用性等高附加值特性获取溢价。英伟达的毛利率常年维持在70%以上。国产GPU若能将毛利率稳定在50%左右,则说明其在特定应用场景中已建立起不可替代的真实商业价值。

  4. 经营活动现金流 = 烧钱速度与生存红线
    芯片公司因需向台积电等先进制程代工厂支付高额预付款,加之HBM等核心元器件供应紧张,其经营活动现金流往往深度为负。这直接考验着公司的持续融资能力与未来的上市造血前景。

基于上述逻辑,本文将剥离市场宣传的杂音,仅从“技术实现”与“财务健康”双重底层视角,对四家公司2025年的最新财报进行拆解。

零、横向技术及财务对比总览

| 指标维度 | 沐曦(MetaX) | 摩尔线程(Moore Threads) | 天数智芯(Iluvatar CoreX) | 壁仞科技(Biren Tech) |
| :— | :— | :— | :— | :— |
| 2025营收 | 16.44 亿元 | 14.50-15.20 亿元 | 10.34 亿元 | 10.35 亿元 |
| 研发费用 | 10.27 亿元 | 持续高投入(未披露) | 9.74 亿元 | 14.76 亿元 |
| 研发费用率 | 62.49% | 未披露 | 94.2% | 142.6% |
| 综合毛利率 | 56.51% | 增长态势(未披露) | 54.0% (训练端 64.2%) | 53.8% |
| 经调整净亏损 | -8.30 亿元 | -9.50 至 -10.60 亿元 | -4.38 亿元 | -8.74 亿元 |
| 核心架构路线 | SIMT架构,训推渲染全覆盖 | MUSA全功能架构 | 训练(天垓)+推理(智铠)+端侧(彤央) | 专注大算力与互连(SuperPod) |
| 集群扩展互连 | MetaXLink (7 links) | 未专门命名,万卡级集群 | 自研通信库,跨节点提效30% | Blink 2.0,首发光互连(dOCS) |
| 底层软件栈 | MXMACA | MUSIFY/MUSA | DeepSpark | BIRENSUPA |
| CUDA兼容/迁移 | 6000+应用,极高兼容性 | 提供迁移工具 | 提效80%,分钟级迁移 | 拥抱Triton/TileLang/vLLM开源栈 |
| 大模型生态 | Day-0适配开源大模型,OCP | 支持万亿参数规模 | MFU提升60%,MoE架构优化 | DeepSeek V3/R1 Day-0适配,FP4 |

从上述数据可以清晰观察到几个核心趋势:
* 商业化全面加速:四家厂商营收均实现翻倍级增长,其中摩尔线程增速领跑,沐曦营收规模位居行业第一,表明产品落地进入快车道。
* 毛利率维持高位:四家厂商综合毛利率均稳定在53%以上,显著高于半导体行业平均水平,体现了国产高端GPU的技术壁垒与定价能力,并非单纯依赖低价策略。
* 研发投入持续高强度:即便营收大幅增长,各公司仍将绝大部分甚至全部收入投入研发,为下一代产品迭代与技术突破提供保障。
* 亏损持续收窄,盈利拐点临近:除壁仞科技因加大下一代产品研发导致亏损小幅扩大外,其余三家亏损均大幅收窄,行业整体已接近盈利拐点前的关键周期。

本文目录

二、 核心厂商财务与技术数据深度剖析

本部分将聚焦于国内四家主要GPU设计公司的关键财务数据与技术进展,通过横向对比,揭示其在高强度研发投入下的商业闭环现状。

一、 沐曦股份(MetaX)

国产GPU生死线:从财报看技术内卷下的商业闭环真相

1. 营业收入:16.44 亿元
* 数据来源:根据年度报告披露,全年实现营业收入16.44亿元,较上年同期增长121.26%。公司解释,这主要得益于曦云C系列等GPU产品出货量显著增长,下游客户从验证阶段进入规模化采购,尤其是在智算中心和运营商领域。
* 技术视点:营收同比翻倍增长,表明其核心产品曦云C系列已跨越早期客户验证,进入智算中心的规模化部署阶段。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

2. 研发费用:10.27 亿元
* 数据来源:年报显示,2025年研发投入达10.27亿元,占营业收入比重为62.49%。绝对金额同比增长14.04%。截至年末,公司拥有675名研发人员,占员工总数73%,其中硕士及以上学历占比超过70%。
* 技术视点:高研发投入率(62.49%)支撑其自研架构与软件栈的持续迭代。研发团队规模与结构足以支撑一个大代际微架构的完整研发周期。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

3. 净亏损:-7.89 亿元
* 数据来源:年报显示2025年归属于上市公司股东的净利润为-7.89亿元。虽然仍处于亏损状态,但较上年同期亏损收窄43.97%,主要原因是收入大幅增长。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

4. 毛利率:56.51%(集成电路行业整体),GPU 产品 56.17%
* 数据来源:年报主营业务分产品情况表显示,集成电路行业整体毛利率为56.51%,其中GPU产品及配件毛利率为56.17%,较上年同期提升2.56个百分点。
* 技术视点:在激烈的市场竞争中保持稳定且略有提升的毛利率,表明其产品在训推一体等场景具备一定的系统级溢价能力,而非单纯依赖低价策略。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

5. 经营活动现金流:-12.60 亿元
* 数据来源:年报现金流量数据显示,2025年经营活动产生的现金流量净额为-12.60亿元。主要原因包括:应收账款随收入规模扩大而增加;为保障供应链安全,对HBM和晶圆等关键物料进行了战略性备货,导致存货余额显著上升。
* 技术视点:负现金流凸显了高端GPU行业在供应链(尤其是HBM)和客户回款周期上的双重压力,企业需依赖外部融资维持运营与备货。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

6. 核心产品与技术进展
* 数据来源:公司产品线覆盖曦云C系列(训推一体)、曦思N系列(智算推理)和在研的曦彩G系列(图形渲染)。技术层面,自研的MetaXLink高速互连技术单芯片集成7个接口,互连带宽达到国际主流水平,支持2-128卡多种互连拓扑。硬件架构上率先支持OCP Microscaling数据格式,以优化大模型推理内存占用。

国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相
* 技术视点:产品线布局完整。硬件上支持OCP Microscaling等前沿数据格式以应对内存瓶颈;互连技术(MetaXLink)的带宽与拓扑灵活性,是支撑其从单卡扩展到大规模集群(Scale Out)的关键。

7. 软件生态(CUDA 兼容)

  • 数据来源:公司自主研发的MXMACA软件栈在API层面高度兼容CUDA生态,已支持超过6,000个CUDA应用,并与1,000多个大模型实现原生适配。特别值得注意的是,公司实现了对DeepSeek、Qwen3.5、智谱GLM-5等前沿开源模型的Day-0适配——即模型发布当天即可在公司GPU上运行。截至2026年3月,开源社区注册用户超过30万人,API调用超5,591万次,表明开发者生态正在快速形成。
  • 技术视点:其核心是 MXMACA 软件栈,采用了 SIMT 架构。报告明确指出支持超过 6000 个 CUDA 应用,与 1000+模型原生适配。特别针对开发者痛点,实现了对 DeepSeek、Qwen3.5、GLM-5 等前沿开源模型的 Day-0 适配。这意味着其底层编译器已具备成熟的算子融合并能承接动态图/静态图的转换。

国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相

国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相

二、 摩尔线程(Moore Threads)

国产GPU生死线:从财报看技术内卷下的商业闭环真相 (科创板代码:688795)

摩尔线程主打“全功能 GPU”(兼顾图形渲染与 AI 算力)。由于提供的是业绩快报,数据粒度较粗,但核心趋势清晰。

1. 营业收入:14.50 亿元 至 15.20 亿元

  • 数据来源:根据公司2026年1月22日发布的《2025年年度业绩预告》,经财务部门初步测算,2025年全年营业收入预计在14.50亿元至15.20亿元之间。与上年同期(4.38亿元)相比,增加了约10.12亿元至10.82亿元,增幅高达230.70%至246.67%。这意味着公司收入不仅首次突破10亿元大关,而且增长超过两倍,势头非常强劲。
  • 技术视点:营收暴增 230%以上。突破 10 亿大关不仅是财务里程碑,更意味着其 MTT S 系列加速卡已经在各大智算中心完成了万卡级别的物理交付。

2. 研发费用:持续高研发投入(具体绝对值未披露)

  • 数据来源:公司在业绩预告中解释业绩变化原因时指出,虽然收入大幅增长、亏损收窄,但目前“仍处于持续研发投入期”。为了保持产品竞争力,公司持续投入大量资金用于GPU架构迭代、软件开发和新产品量产,这是导致尚未盈利的主要原因。不过预告未披露研发费用的具体金额。
  • 技术视点:预告中客观承认“与部分国际巨头相比,公司在产品客户生态等方面仍存在一定差距”。摩尔线程的软件栈 MUSA 一直在主推对 CUDA 的零成本迁移(MUSIFY 工具),这种坦诚意味着在一些长尾算子或最新大模型复杂混合精度支持上,底层库仍需时间打磨。

3. 净亏损:-9.50 亿元 至 -10.60 亿元

  • 数据来源:根据同一份业绩预告,公司2025年归属于母公司所有者的净利润预计亏损9.50亿元至10.60亿元。虽然仍在亏损,但与上年同期(亏损16.18亿元)相比,亏损额减少了5.58亿元至6.68亿元,收窄幅度达到34.50%至41.30%。简单来说,去年每收入1元钱要亏掉约3.7元,今年每收入1元钱只亏约0.7元,亏损程度明显减轻。
  • 技术视点:相比去年的-16.18 亿,亏损大幅收窄 34%以上。这说明其硬件流片的良率、出货的规模效应已经开始摊薄早期的沉没成本。

4. 毛利率:推动收入与毛利增长(具体未披露)

  • 数据来源:公司在分析业绩变化原因时明确提到,“得益于人工智能产业蓬勃发展及市场对高性能GPU的强劲需求,公司产品竞争优势进一步扩大……推动收入与毛利增长,整体亏损幅度同比收窄。”这表明随着出货量增加和产品结构优化,单位产品的毛利在提升,但预告没有披露具体的毛利率百分比。
  • 技术视点:预告中客观承认“与部分国际巨头相比,公司在产品客户生态等方面仍存在一定差距”。摩尔线程的软件栈 MUSA 一直在主推对 CUDA 的零成本迁移(MUSIFY 工具),这种坦诚意味着在一些长尾算子或最新大模型复杂混合精度支持上,底层库仍需时间打磨。

5. 经营活动现金流:未披露

  • 数据来源:本次业绩预告仅包含营业收入、净利润等损益表数据,未披露经营活动产生的现金流量净额。投资者需等待公司正式发布的《2025年年度报告》以获取完整的现金流信息。

6. 核心产品与技术进展

  • 数据来源:公司在预告中重点披露了产品进展:成功推出旗舰级“训推一体全功能GPU智算卡MTT S5000”,并且已经实现规模量产。更关键的是,基于这款智算卡构建的大规模计算集群已经完成建设并上线提供服务,能够高效支持“万亿参数”级别的大模型训练,计算效率达到同等规模国外同类GPU集群的先进水平。
  • 技术视点:成功推出旗舰级训推一体全功能 GPU 智算卡 MTT S5000 ,并实现规模量产。报告特别强调了“基于该产品构建的大规模集群已完成建设并上线服务,可高效支持万亿参数大模型训练”,这意味着其卡间通信(类似 NVLink 的 MUSA 互连)和网络拓扑(RoCEv2 等)已经能够承载超大规模并行分布式训练(数据并行/张量并行/流水线并行)。

7. 软件生态(CUDA 兼容)

  • 数据来源:公司在总结与行业巨头的差距时坦诚承认:“与部分国际巨头相比,公司在综合研发实力、核心技术积累、产品客户生态等方面仍存在一定的差距。”这种客户生态的差距,正是软件生态成熟度的体现。不过公司并未在本次预告中详细披露MUSA对CUDA的兼容进度或具体迁移工具的表现。
  • 技术视点:预告中客观承认“与部分国际巨头相比,公司在产品客户生态等方面仍存在一定差距”。摩尔线程的软件栈 MUSA 一直在主推对 CUDA 的零成本迁移(MUSIFY 工具),这种坦诚意味着在一些长尾算子或最新大模型复杂混合精度支持上,底层库仍需时间打磨。

三、 天数智芯(Iluvatar CoreX)

国产GPU生死线:从财报看技术内卷下的商业闭环真相 (港交所代码:9903)

天数智芯是国内较早切入通用 GPGPU 赛道的厂商,今年成功登陆港股,其报表透明度较高。

1. 营业收入:10.34 亿元

  • 数据来源:根据公司《截至2025年12月31日止年度年度业绩公告》财务摘要,2025年全年收入为10.34亿元人民币,较2024年的5.40亿元大幅增长91.6%。其中,通用GPU产品(天垓训练系列+智铠推理系列)贡献了9.23亿元,占总收入的89.3%。这一增长主要得益于通用GPU产品出货量同比增加168.5%,训练系列和推理系列分别增长131.5%和194.8%。公司已从早期依赖定制化AI算力解决方案的模式,成功转型为以标准化芯片销售为主营业务的算力供应商。
  • 技术视点:通用 GPU 产品(天垓+智铠)贡献了 89.3%的营收。这说明其从早期的定制化解决方案(按项目制走)成功转型为标准化的算力芯片供应商。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

2. 研发费用:9.74 亿元

  • 数据来源:综合损益及其他综合收益表显示,2025年研发开支为9.74亿元,同比增长26.1%(2024年为7.73亿元)。增长主要来自两方面:一是研发团队扩充带来的员工成本增加(较上年增加1.76亿元),公司研发人员已超过530人,其中70%以上拥有硕士或以上学位,超三分之一具备十年以上行业经验;二是流片费用、技术服务和材料消耗等随研发项目数量增加而上升。这些投入支撑了天垓下一代产品、智铠推理芯片以及端侧“彤央”系列的持续迭代。
  • 技术视点:同比增长 26.1%,主要用于扩充 530 人以上的研发团队及流片费用。高比例的硕士/资深专家团队是深水区底层软件(如自研通信库、仿真库)研发的必要条件。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

3. 净亏损:-10.04 亿元(经调整净亏损 -4.38 亿元)

4. 毛利率:54.0%

  • 数据来源:财务摘要及毛利明细显示,2025年整体毛利率为54.0%,高于2024年的49.1%。分产品看,天垓训练系列毛利率高达64.2%(同比提升4个百分点),主要因客户需求旺盛带动定价上涨;而智铠推理系列毛利率为39.2%(同比下降7.5个百分点),原因是公司主动降低售价以抢占更大的推理市场份额并加速库存销售。这种分化恰恰反映了训练芯片供给稀缺、议价能力强,而推理芯片市场竞争激烈、厂商以价换量的行业现状。
  • 技术视点:天垓(训练)系列的毛利率高达64.2%,而智铠(推理)系列由于采取抢占市场份额的策略,毛利率降至39.2%。这反映了推理端算力市场的内卷现状,而在训练端,由于供给稀缺,仍享有高议价权。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

5. 经营活动现金流:-11.62亿元

  • 数据来源:流动资金及资金来源表显示,2025年经营活动所用现金净额为11.62亿元,较2024年的6.18亿元有所扩大。这主要是公司仍处于快速扩张期,研发投入和备货(存货从3.43亿元增至7.10亿元)消耗了大量现金。不过,得益于2026年1月港股上市融资(全球发售所得款项净额约35.09亿港元),公司年末现金及现金等价物从2024年的3.14亿元大幅提升至15.05亿元,短期流动性充足。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

6. 核心产品与技术进展

  • 数据来源:业务回顾部分详细介绍了产品迭代:天垓系列(训练)已推出Gen2,出货量同比增长131.5%;智铠系列(推理)强化了整数计算单元,出货量增长194.8%,在金融、医疗、交通等行业规模应用。公司还发布了面向机器人、智能终端的“彤央”系列端侧产品,形成云边端协同布局。在集群技术方面,自研通信库实现跨节点效率提升30%,已稳定支撑万卡级规模集群运行;算力利用率(MFU)达到行业领先水平,大模型长文本处理效率提升50%以上。
  • 技术视点:天垓系列(大规模训练)推出Gen2,智铠系列(推理)强化了整数计算单元以适应大模型量化部署(INT8/INT4等低精度类型)。此外,公司推出了“彤央”系列切入具身智能与端侧边缘计算,形成了云边端协同。特别值得注意的是,其自研通信库实现了跨节点通信效率提升30%,稳定支撑万卡规模。

国产GPU生死线:从财报看技术内卷下的商业闭环真相

7. 软件生态(CUDA兼容)

  • 数据来源:业务回顾指出,公司全新一代软件开发平台原生兼容主流GPU编程模型,代码迁移效率提升80%以上,支持算子“分钟级”平滑迁移。DeepSpark开源社区已完成超过610个主流算法模型适配。针对大模型训练与推理,自研加速库实现系统算力利用率(MFU)提升60%,集群通信开销降低30%,并已成功支撑头部大模型厂商的生产级集群部署。
  • 技术视点:天数智芯的主力平台是DeepSpark开源社区。原生兼容主流GPU编程模型,代码迁移效率提升80%以上,实现了算子“分钟级”平滑迁移。针对当前业界最热的长文本处理(Long Context)与MoE大模型训练,系统算力利用率(MFU)提升了60%,通信开销降低30%。

国产GPU生死线:从财报看技术内卷下的商业闭环真相 国产GPU生死线:从财报看技术内卷下的商业闭环真相

四、 壁仞科技(Biren Technology)

国产GPU生死线:从财报看技术内卷下的商业闭环真相

壁仞科技在2025年迎来了商业化落地的拐点,并于2026年初成功登陆港股,获得了巨额资金补充。

1. 营业收入:10.35亿元

  • 数据来源:年报“RESULTS SUMMARY”显示,2025年公司收入达10.35亿元,相比2024年的3.37亿元,暴涨207.2%。其中10.28亿元来自“智能计算解决方案”——也就是基于BR10X系列芯片交付的千卡/万卡级集群。年报解释,这一增长主要因为BR106、BR166等产品实现规模量产和出货,同时交付了多个千卡级集群,客户群也迅速扩大。
  • 技术视角:收入几乎全部来自集群方案,说明壁仞已经走通了“芯片 → 板卡 → 集群”的商业化路径,不再停留在单品销售。

2. 研发费用:14.76亿元

  • 数据来源:年报“RESULTS SUMMARY”列明,2025年研发费用14.76亿元,比2024年的8.27亿元增长了78.5%。这笔钱主要花在了三方面:加大研发技术服务和设备折旧投入(支撑产品快速迭代)、扩充研发团队、以及增加股权激励开支。
  • 技术视角:壁仞是四家企业中研发投入最高的。同比近八成的高增长,说明它正在全力攻坚下一代BR20X芯片和超大规模集群互连技术(比如光互连),处于产品迭代的“攻坚期”。

3. 净亏损:-164.93亿元(经调整净亏损-8.74亿元)

  • 数据来源:年报“RESULTS SUMMARY”显示,2025年账面净亏损164.93亿元,但紧随其后给出了“经调整净亏损”仅为8.74亿元。这巨大的差额主要来自“赎回负债公允价值变动”——这并非公司经营烧掉的钱,而是一笔会计处理。简单说,公司上市前向早期投资人承诺了“如果到期没上市,他们要能赎回股份”,这项义务在账上被记为负债。上市后该义务自动消失,负债转成权益,账面上会体现为一大笔“亏损”,但实际上不影响现金流。剔除这个以及股权激励、上市费用后,真实经营亏损为8.74亿元。
  • 技术视角:百亿级账面亏损主要源于上市前融资条款的会计处理。真正反映经营活动的现金亏损是8.74亿元,这在高速成长的芯片公司中属于正常水平。

4. 毛利率:53.8%

  • 数据来源:年报显示,2025年毛利5.57亿元,毛利率53.8%,比2024年提升了0.63个百分点。成本端同步增长203%,与收入增幅匹配。
  • 技术视角:毛利率超过50%,意味着每卖出100元的产品,扣除芯片生产成本、封装测试等直接成本后,还能剩下近54元用来覆盖研发、销售和管理费用。这个水平在国产GPGPU初创公司中相当健康。

5. 现金及等价物储备:28.96亿元(上市前)

  • 数据来源:年报及资产负债表显示,截至2025年底,公司持有的现金、银行存款、受限资金及短期理财产品合计28.96亿元。同时披露,2026年初H股上市募资净额56.31亿元。
  • 技术视角:上市前已有近29亿元现金,加上上市募集的56亿元,壁仞目前手握超过85亿元。这是四家企业中资金最充裕的一家,足够支撑未来2–3年的先进制程流片和先进封装(如CoWoS)采购,为其持续高强度研发提供了坚实的资金保障。

6. 核心产品与技术进展

五、 面向技术从业者的核心结论与选型建议

在深入分析四家公司的财务与技术报告后,可以明确国产GPU行业已脱离“概念炒作”阶段。超过10亿元人民币的营收规模,证明了这些芯片已在实际数据中心中运行,承担着真实的计算负载。

基于技术落地与商业可持续性,提出以下预判与选型建议:

1. 软件生态成熟度:从“兼容CUDA”到“拥抱高层编译”

早期国产GPU的软件策略多局限于实现CUDA兼容层。当前,主流厂商已发展出两条更成熟的路径:

  • 路线A:高保真兼容。通过大量工程投入,在指令集和底层库层面实现深度对接。若现有业务严重依赖历史遗留的、高度定制化的CUDA算子,可优先评估此类厂商的迁移平滑度。
  • 路线B:拥抱开源高层编译器。此路线主动适配如Triton、TileLang等开源编译器生态。开发者可使用高层语言(如Python/Triton)编写算子,由厂商的编译器后端负责硬件适配与优化。这大幅降低了开发者的迁移成本,尤其适合紧跟PyTorch、vLLM、SGLang等现代AI框架的团队。

2. 硬件性能与集群量产:互连与规模化成为关键

在单卡性能受制于先进制程与HBM产能的背景下,大规模集群的互连能力成为竞争焦点

  • 训练集群(Scale-out):构建千卡以上大规模预训练集群时,需重点考察厂商的自研高速互连技术(如光互连方案)及其通信软件栈的性能与稳定性,这对解决All-Reduce等集合通信瓶颈至关重要。
  • 推理场景(Scale-up / 成本):部分厂商的推理产品毛利率已出现显著下降,表明该领域竞争激烈。对于需要大规模部署云端或边缘推理服务的企业,当前是评估国产GPU以降低总拥有成本(TCO)的合适窗口期。

3. 财务安全性与供应链可持续性

技术选型需考虑厂商的长期生存能力。芯片行业研发投入巨大,现金流持续为负是普遍现象。

  • 选择长期战略合作伙伴时,应关注其现金流储备、持续融资能力及营收造血能力。充足的资金是保障其预付先进制程产能、持续进行芯片迭代(Tape-out)的基础。
  • 高研发费用率与经营现金净流出是行业常态,但需警惕资金链断裂导致底层驱动和软件栈停止维护的风险。

4. 不同场景的选型总结

  • 主攻大规模预训练与超算中心:应重点考察具备大规模集群实际部署经验先进互连技术的厂商。
  • 主攻云边端协同与多模态推理:可重点考察在推理场景有深度优化、且产品线覆盖云端与边缘的厂商,关注其性价比与能效比。
  • 强依赖开源高层框架的团队:优先选择软件栈已与Triton、vLLM等生态深度集成的平台,以最大限度降低迁移与开发成本。

结语:跨越营收门槛后的挑战

四家厂商均跨过了10亿营收的门槛,但这仅是新一轮竞争的起点。财报揭示了行业共同面临的严峻挑战:

事实一:盈利尚未实现,亏损仍在持续。
各家公司的经调整净亏损额依然可观,营收尚无法覆盖高昂的研发与运营成本,距离真正的自我造血仍有距离。

事实二:研发投入巨大,现金流依赖外部输血。
极高的研发费用率吞噬了大部分营收,经营现金流持续为负是普遍状况。行业的健康发展高度依赖持续的融资能力与资本市场支持。

事实三:软件生态仍以兼容为主,构建原生生态任重道远。
“支持数千CUDA应用”、“分钟级迁移”等表述,本质上仍是对现有生态的兼容与翻译。构建独立、高效且对开发者友好的原生编程模型与软件栈,是摆脱被动跟随、建立长期竞争力的关键。

事实四:毛利率分化,细分市场内卷加剧。
不同厂商及产品线的毛利率出现显著分化,部分推理产品已进入价格竞争阶段,反映了市场在不同赛道上的竞争烈度。

天数智芯的推理卡毛利率已降至39.2%,公司承认此举意在“主动降价抢占市场份额”。这表明国产GPU在推理侧已陷入红海竞争——产品同质化严重,客户仅关注每token成本,品牌忠诚度无从谈起。训练侧的高毛利率(天数智芯为64.2%)可能只是暂时现象。一旦国际厂商填补供给缺口,国产训练卡能否维持50%以上的毛利率,将面临巨大考验。

真正的考验是什么?

风险并非仅存在于营收最低的厂商——即便达到10亿营收也未必安全。真正的风险在于那些 研发投入难以为继、现金流无法支撑下一个流片周期、软件生态始终落后于CUDA 的参与者。最核心的问题在于:主要厂商仍在同质化竞争,尚未有任何一家建立起不可替代的技术壁垒或稳固的开发者生态。

对开发者而言,选型决策不应基于“爱国情怀”,而应基于 哪家厂商能存活到你的模型上线并完成下一次迭代 。在迁移代码前,建议先思考三个现实问题:

  1. 这家公司三年后是否依然存在? 审视其现金储备与融资能力。目前壁仞情况相对稳健,沐曦、天数智芯、摩尔线程则需持续关注其后续融资进展。
  2. 如果英伟达明天开源一套更高效的算子库,该厂商的兼容层需要多久才能跟进? 评估其研发团队规模与历史迭代速度。
  3. 你的团队是否愿意长期绑定其特有的“类CUDA”方言,还是最终仍需重写回标准CUDA? 观察其是否积极拥抱Triton等开源编译器生态,而非重复构建封闭的技术栈。

国产GPU的“生死线”并非某个营收数字,而在于 能否在现金流枯竭之前,实现单季度经营现金流转正 。到2026年,市场将不再满足于“亏损收窄”这类表述——真正需要关注的是 正向的经营现金流 以及 不依赖外部融资的自我造血能力

否则,当潮水退去,缺乏生存根基的参与者将失去上岸的机会。

国产GPU生死线:从财报看技术内卷下的商业闭环真相


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/28923

(0)
上一篇 2小时前
下一篇 2小时前

相关推荐

  • 强化学习重塑记忆系统:Mem-α如何让大模型学会“主动记忆”

    在人工智能领域,大语言模型的快速发展正将“记忆”问题推向技术前沿。当前,即使是最先进的GPT-4.1等模型,在处理持续增长的交互时,仍面临成本与延迟的指数级上升挑战。传统的外部记忆系统大多依赖人工规则与预设指令,导致模型缺乏对“何时记忆、记忆什么、如何更新”等核心问题的真正理解。Mem-α的出现,标志着记忆管理从规则驱动向学习驱动的范式转变——这项由加州大学…

    2025年11月7日
    26200
  • 2026年企业级RAG系统构建指南:8大关键工具避免生产环境陷阱

    每个可靠的企业级 RAG 系统背后的 8 个关键工具 我第一次认真构建检索增强生成(RAG)系统时,犯了大多数团队都会犯的同样错误。 我以为 RAG 的核心是选对模型。 其实不是。 企业级 RAG 关注的是模型之外的一切——那些枯燥、脆弱、不光鲜,但决定你的系统能否多年稳定运行、还是在真实流量面前崩塌的部分。 当你越过演示阶段,进入生产环境时,你会发现 RA…

    2026年1月27日
    60400
  • 国产AI视频模型Vidu Q3 Pro登顶国际榜单,音画同步16秒直出引领视频生成新突破

    国产AI视频模型直接和马斯克的Grok掰手腕了。 智东西1月30日报道,今日,来自生数科技的AI视频模型Vidu Q3 Pro登上国际权威AI基准平台Artificial Analysis榜单,位列中国第一,全球第二。 这是最新榜单内,首个打入国际第一梯队的国产视频生成模型。它仅次于马斯克旗下xAI的Grok,领先于Runway Gen-4.5、Google…

    2026年1月30日
    44600
  • 国产GPU生态崛起:摩尔线程首届开发者大会的技术战略与产业影响深度解析

    2025年12月20日至21日,摩尔线程将在北京中关村国际创新中心举办首届MUSA开发者大会(MDC 2025),这不仅是国内首个聚焦全功能GPU的开发者盛会,更是国产算力生态建设的重要里程碑。在国产GPU龙头完成IPO后,此次大会的战略意义远超普通技术会议,它标志着中国GPU产业从技术追赶阶段正式进入生态构建阶段。 从技术架构层面分析,MUSA统一系统架构…

    2025年12月9日
    26900
  • Anthropic逆天狂飙:美国市场份额70%、年化收入200亿美元,Claude全面碾压OpenAI

    Anthropic的市场表现引发了广泛关注。数据显示,截至2026年2月,其在美国AI市场的份额已迅速增长至近70%,实现了对OpenAI的反超。 在约一年时间内,ChatGPT原本占据主导的市场份额,大部分已被Claude系列产品所获取。 更引人注目的是其财务表现。据报道,Anthropic的年化收入(ARR)已接近200亿美元,并在两周内增长了约50亿美…

    2026年3月5日
    36800