全球首份大模型公司年报出炉:MiniMax营收暴涨158.9%,亏损率大幅收窄

全球首份大模型公司年报出炉:MiniMax营收暴涨158.9%,亏损率大幅收窄

全球大模型行业迎来了首个真正可量化的财务样本。

港交所上市仅52天后,MiniMax发布了IPO后的首份年度业绩报告。数据显示,截至2026年2月,其年度经常性收入(ARR)已突破1.5亿美元。2025年全年,公司总营收同比增长158.9%,毛利同比飙升437%,净亏损率则显著收窄。

这份年报的意义不仅在于展示一家公司的业绩,更在于为市场观察“大模型如何实现商业化”提供了一个宝贵窗口,也是衡量中国AI公司全球竞争力的重要风向标。

全球首份大模型公司年报,表现如何?

2025年是MiniMax开启规模化商业化的第二年。公司全年总营收达到7904万美元,同比 暴涨158.9%,其中 超过70% 的收入来自国际市场。

与此同时,公司经调整后的净亏损为2.5亿美元, 净亏损率 已大幅收窄。这意味着公司在收入快速增长的同时,亏损正在有效收窄。

MiniMax的收入增长主要得益于AI原生产品和开放平台业务的“双轮驱动”。

其营收来源主要分为两大类:面向 C端 用户的AI原生产品订阅收入,以及面向 B端 的开放平台及其他企业服务收入。

全球首份大模型公司年报出炉:MiniMax营收暴涨158.9%,亏损率大幅收窄

  • AI原生产品收入:这部分收入来自 MiniMax、MiniMax语音、海螺AI、星野 等应用的订阅服务。截至2025年末,MiniMax的累计用户已超过 2.36亿,覆盖全球超过200个国家和地区。2025年,该业务贡献营收5308万美元,同比增长143%,占总营收的67.2%。
  • 开放平台及企业服务收入:这部分业务通过API调用量计费, 在2025年为MiniMax带来2596.3万美元收入,同比增长197.8%

在财报电话会议上,MiniMax创始人闫俊杰透露了最新进展:文本模型驱动的生产力场景增速在今年更为明显。

例如,M2系列文本模型在2026年2月的平均单日token消耗量,已增长至2025年12月水平的6倍以上,其中来自CodingPlan的token消耗量增长超过10倍。

今年2月,开放平台的新注册用户数已达到2025年12月的 4倍以上。目前,MiniMax拥有来自超过100个国家和地区的 21.4万企业客户及开发者,且开放平台收入中超50%由海外市场贡献。

这种“C端+B端”双轮驱动的模式,为MiniMax提供了稳定且可预测的经常性收入,显著提升了盈利能力。

2025年,MiniMax的毛利达到2008万美元,同比猛涨437%,增速远超营收。公司的 毛利率 也从2023年的-24.7%,转正至2024年的12.2%,并在2025年进一步提升 13.2个百分点至25.4%

全球首份大模型公司年报出炉:MiniMax营收暴涨158.9%,亏损率大幅收窄

毛利水平的提升主要得益于模型与系统效率的优化,以及基础设施配置的改进。结合大幅收窄的净亏损率来看,MiniMax正朝着可持续的商业化闭环稳步迈进。

支撑这一成绩的是持续的研发投入。2025年,MiniMax的研发开支为2.5亿美元,同比增长33.8%。更值得关注的是研发效率指标:研发开支占总营收的比重已从2024年的619%显著下降至2025年的320%。

截至2025年末,公司现金储备(含现金及等价物、受限制现金及定期存款等)为 10.5亿美元,高于2024年末的8.8亿美元。上市后股价的上涨,进一步充实了其资金“弹药库”。

整体而言,这份年报显示MiniMax已进入加速发展阶段。那么,这种爆发式增长背后,是怎样的技术和产品在支撑?

产品密集迭代,商业化加速落地

2025年是MiniMax技术全面进击、商业化加速落地的一年。公司构建了涵盖语言、视频、语音、音乐的全模态研发能力。尤其在语言模型方面,自2025年第四季度至2026年年初的108天内,连续完成了M2、M2.1、M2.5三代模型的迭代,展现了行业领先的研发速度。

下半年开始,MiniMax的产品迭代进入“狂飙”模式:

  • M2模型:发布时采用了传统的全注意力机制以保障任务稳定性,旨在 打破智能水平、运行速度与算力成本之间的“不可能三角”。该模型曾在香港大学的AI-Trader模拟A股大赛中获得第一名。
  • M2.1模型:作为旗舰级编程与智能体模型, 在多语言编程基准测试中达到全球SOTA水平,并补齐了全栈开发的短板,获得了业界好评。
  • M2.5模型在代码与智能体能力上更进一步,同时变得更轻、更快、更经济。其推理速度可达100 TPS,并能进行完整的全栈开发。近期,Notion宣布在其Custom Agents中正式引入开源模型MiniMax M2.5,标志着该模型正深入国际主流生产力工具的核心场景。

全球首份大模型公司年报出炉:MiniMax营收暴涨158.9%,亏损率大幅收窄

在模型迭代期间, 作为模型智能体能力“脚手架”的MiniMax Agent平台也经历了两次重要更新
* 2026年1月,上线2.0版本,推出桌面版以 深度融入本地工作环境,并上线Experts系统,允许用户创建 专属的垂直领域专家
* 春节后再次更新,Experts系统的社区应用数量 已突破一万。平台还跟进热点推出了 MaxClaw 模式,简化了云端部署流程。

迎接2026:瞄准超级PMF,迈向AI平台型公司

当前大模型赛道迭代加速,竞争日趋激烈。未来的赢家需要具备技术、产品与商业化综合实力。

用MiniMax CEO闫俊杰在财报电话会议上的话说,公司需要拥有定义新智能范式的能力,并为此未雨绸缪。从2025年下半年开始,MiniMax就已积极布局,准备迎接他们认为将在2026年涌现的几个“超级产品-市场匹配(PMF)”机会。

  • 编程领域:AI编程将迈向L4至L5级别的智能,AI将从“工具”演变为“同事级”的协作者。其中,L4级别指AI能对工程及复杂算法问题提出创新性解决方案;L5级别则要求多个智能体能像人类一样被有效组织和协作。
  • 办公领域:覆盖各职业的Workspace办公场景,其范围更广、市场空间更大,复杂度也高于编程领域。但MiniMax相信,办公场景将复刻过去一年编程领域的进步速度。
  • 多模态创作:AI创作工具将能够生成“直出可交付”的中长内容,并涌现出流式、实时输出的新形态。例如,MiniMax已在其海螺AI产品中升级了Media Agent,支持全模态全能创作与一键成片。

这意味着新的技术挑战即将来临,更大规模的智能供给即将爆发,应用层将迎来巨大的创新窗口期。

以MiniMax为代表、以多模态模型为核心的AI公司,其承载的需求将被放大,Token量级很可能出现1-2个数量级的增长

为此,MiniMax已做好准备,其正在研发的M3和海螺3系列模型,正是为应对这些挑战而设计。

面对这一机遇,MiniMax将从一家大模型公司,全面升级为“AI平台型公司”,以智能密度与模型吞吐为核心指标,推动AI成为全球新一代生产基础设施。

在MiniMax看来,当智能边界被突破时,将催生大量新场景与新用户,进而形成新的生态与商业化红利。有能力定义这一智能边界,并在产品与商业上享受其红利的公司,即是其所定义的“AI平台型公司”。

用更通俗的方式解释,一家AI时代平台公司的价值,可简化为智能密度 × Token吞吐。当两者均足够强大时,平台价值自然显现。

在MiniMax的路线图中,M3与海螺3正是对这一价值公式的极致践行——该系列模型的研发将持续优化推理架构与算力效率。

可以预见,智能的边界正在被重新定义,2026年或将成为AI从“工具时代”迈向“生态时代”的关键分水岭。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/23739

(0)
上一篇 2026年3月3日 下午2:00
下一篇 2026年3月3日 下午3:41

相关推荐

  • 文心5.0正式版发布:2.4万亿参数原生全模态架构,登顶LMArena的“最强文科生”技术解析

    2.4万亿参数,原生全模态架构,在文本榜上“霸榜如喝水”。 在文心Moment大会上,文心大模型5.0正式版 上线。该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。在40余项权威基准的综合评测中,文心5.0正式版的语言与多模态理解能力稳居国际第一梯队。其音频和视觉生成能力与垂直…

    2026年1月24日
    21400
  • Hulu-Med:开源统一医学视觉语言大模型,破解医疗AI碎片化与透明度困局

    在医疗人工智能领域,长期以来存在着两大核心挑战:任务与模态的碎片化,以及技术实现的不透明性。传统医学AI模型通常针对特定任务(如影像诊断、病理分析或手术指导)和单一模态(如2D图像、3D体积或文本)进行优化,形成了众多性能卓越但彼此孤立的“专科助手”。这种碎片化架构不仅导致临床应用中需要拼凑复杂系统来处理多模态数据,增加了维护成本,更限制了AI从跨模态关联中…

    2025年11月13日
    18900
  • 谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,多项基准测试刷新纪录,重新登顶AI模型王座

    上周,谷歌发布了 Gemini 3 Deep Think 的一次重大更新,以应对当今科学、研究和工程领域的复杂挑战。而就在刚刚,谷歌正式推出支撑这些突破的升级版核心智能:Gemini 3.1 Pro。 参与了 Gemini 3 Deep Think 研究的姚顺宇也发推介绍了这项新突破,并表示:「后续还会有更好的模型源源不断地涌现」。 谷歌表示,基于 Gemi…

    2026年2月20日
    21200
  • 百度ERNIE 5.0:万亿参数统一多模态大脑,原生自回归架构颠覆AI设计范式

    克雷西 发自 凹非寺 模型发布近3个月后,百度ERNIE 5.0的技术报告终于公布。 其底座采用超级稀疏的Ultra-Sparse MoE架构,参数量高达万亿,但推理时真正激活的参数不到3%,是目前公开模型中首个实现这一规模的统一自回归模型。 在架构设计上,ERNIE 5.0拒绝“拼接”,真正实现了文本、图像、视频和音频四种模态的原生自回归统一,让所有模态从…

    2026年2月10日
    14700
  • ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画

    ArcFlow:非线性流技术实现40倍推理加速,2步生成媲美原画 在图像生成领域,扩散模型通常需要数十步的迭代去噪才能生成高质量图像,这带来了高昂的计算成本,阻碍了实时应用。为了加速推理,常见的知识蒸馏方法试图将生成过程压缩到几步之内,但它们通常假设从噪声到图像的路径是一条直线,而预训练教师模型的实际生成轨迹往往是复杂的曲线。这种“几何失配”导致学生模型在几…

    2026年2月15日
    8000