Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

Agent时代需要怎样的计费与工程哲学?小米MiMo大模型负责人罗福莉近期在社交平台X上阐述了她的观点。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

此前,一则消息引发关注:Anthropic宣布,Claude Pro和Max订阅用户将不能再将其订阅额度用于OpenClaw等第三方Agent框架。若想继续使用,必须切换至按用量付费的API模式。这一变动让许多依赖订阅模式使用Claude构建Agent的用户措手不及。

Anthropic官方对此解释称,订阅制的定价模型是基于“个人用户正常使用强度”设计的。然而,OpenClaw这类自动化代理工具的使用强度远超预期——有重度用户每月仅支付20美元订阅费,却消耗了价值高达5000美元的算力资源,给Anthropic带来了巨大的成本压力。

消息一出,反响各异。部分用户感到“被背刺”,认为订阅模式的吸引力骤降;也有人表示支持,认为此举有助于清理低效使用,保障平台整体的可持续性。

无论立场如何,一个核心问题已然凸显:当前基于token的计费模式正面临严峻挑战,行业需要更智能、更可持续的算力使用与计费方式。

订阅制背后的成本“深坑”

在帖子中,罗福莉首先指出,Anthropic的订阅制很可能一直在亏损运营。

Claude Code的订阅制是一套设计精良的算力均衡分配系统。我的判断是——它大概率不赚钱,甚至可能在亏钱,除非他们的API利润率能达到10-20倍,但我对此存疑。第三方框架接入造成了多大亏损,我无法精确计算,但我近距离观察过OpenClaw的上下文管理——写得很差。在一个用户请求内,它会触发多轮低价值的工具调用,每次都以独立的API请求发出,且每次都携带极长的上下文窗口(往往超过10万token)——即便缓存命中,也极度浪费,极端情况下还会拉高其他请求的缓存未命中率。

折算下来,每个用户请求实际触发的API调用次数,是Claude Code自身框架的好几倍。换算成API定价,真实成本大概是订阅价格的几十倍。这不是差距——这是一个坑。

阵痛倒逼工程进步

对于此次订阅用户被切断访问权限带来的“阵痛”,罗福莉认为,长期来看这有益处,将倒逼工程实践的进步。

OpenClaw、OpenCode这类第三方框架仍然可以通过API调用Claude,只是不能再搭订阅制的便车了。短期内,这些Agent用户的成本将轻松上涨几十倍,感受会很强烈。但这种压力,恰恰是推动这些框架认真改进上下文管理、最大化提示词缓存命中率以复用已处理上下文、削减无效token消耗的动力。痛苦终将转化为工程纪律。

同时,她向大模型公司发出警告:切勿盲目卷入价格战,以极低价出售token却放任第三方工具“薅羊毛”是一个陷阱。

我想劝大模型厂商们,在没想清楚如何为编程类订阅定价、不至于导致巨额亏损之前,不要盲目卷到价格底部。把token卖得极便宜、同时对第三方框架敞开大门,表面上对用户友好,实则是个陷阱——Anthropic刚刚从这个陷阱里爬出来。更深层的问题在于:如果用户把时间和精力耗费在质量低劣的Agent框架上、耗费在极不稳定又缓慢的推理服务上、耗费在为降本而缩水的模型上,最后发现还是什么事都做不成——这对用户体验和留存都是恶性循环。

小米的应对:MiMo Token Plan

罗福莉随后介绍了小米近期推出的MiMo Token Plan,并强调了其设计理念。

关于MiMo Token Plan——它支持第三方框架接入,按token配额计费,逻辑与Claude新推出的额外用量包一致。因为我们追求的是长期稳定地交付高质量的模型和服务——不是让用户冲动付款,然后弃船而去。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来
Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

未来出路:协同进化,而非廉价Token

她最后指出,当前全球算力供给的增长速度已经跟不上Agent应用所创造的token需求。真正的出路并非更便宜的token,而是“更省token的Agent框架”与“更强大、更高效的模型”之间的协同进化。

罗福莉认为,Anthropic此次的行动,无论其初衷如何,客观上都在将整个生态系统——包括开源和闭源——推向这个方向。这或许是件好事。

社区热议:从定价争议到结构重写

罗福莉的观点在开发者社区引发了强烈反响,讨论焦点迅速从“Anthropic做得对不对”升级为几个更根本的问题:

1. 这不是一场定价争议,而是AI经济学的结构性重写。

正如罗福莉所言,AI服务的单位成本,从来不是由模型单独决定的,而是由“模型 × 框架 × 上下文管理”三者叠加决定。Anthropic的这次行动,无意中对Agent框架进行了一次自然选择压力测试。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

更有观点直言:Anthropic此举传递的真正信号是——编排层(Orchestration Layer)本身才是产品,而不仅仅是底层模型。订阅制与API计费之间的张力,不过是这个更深层逻辑的表面症状。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

2. 别急着批判定价,先审视算力是如何被浪费的。

罗福莉提到的“算力浪费”引发了众多从业者的共鸣。有人一针见血地指出:这根本不是“AI太贵”的问题,而是“算力被糟蹋”的问题——粗糙的框架设计、庞大的上下文窗口加上不必要的冗余调用,烧掉大量资金却换不来相应的真实产出。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

一位开发者的洞察更为深刻:Claude Code内部对上下文的处理决策,从来不是什么默认参数,而是将“保留什么、丢弃什么、何时压缩”这类反复推敲后的工程判断力,深度烘焙进架构的结果。第三方框架缺乏的往往不是功能,而是这种内置的、经过深思熟虑的“工程意见”。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

另一位开发者则以自身经历佐证了这一点:他上个月花费大量时间清理为客户搭建的旧编排层中的冗余逻辑,“清理烂摊子,比当初搭建时费力多了”。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

3. 市场淘汰赛已启动,但结局未定。

罗福莉认为成本压力将倒逼框架进化,但开发者们提出了一个更尖锐的问题:第三方框架能否足够快速地将效率差距补上,使得基于API的定价在经济上仍然可行?还是大多数用户会因为成本过于惨烈,而直接默认回归Claude Code等官方平台?

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

这两条路径将通向截然不同的生态格局。有开发者补充道:框架开发者真正需要的,不是“被包含在内”的模糊接入权,而是清晰、可预期的token配额与限制——明确的边界反而会催生更优的产品行为,模糊的灰色地带只会制造混乱与低效。

Agent时代计费革命:小米MiMo负责人深度解析Anthropic订阅制变革与行业未来

结语

罗福莉的这篇帖子,被视为一个极具前瞻性的技术演进信号,相关讨论也切中了当前AI软件工程领域的核心痛点。接下来,市场将如何从“粗放式燃烧算力”转向“精细化工程架构”,值得持续关注。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/28759

(0)
上一篇 6小时前
下一篇 6小时前

相关推荐

  • NVIDIA CUDA 13.1深度解析:Tile编程模型引领GPU计算新范式

    NVIDIA CUDA Toolkit 13.1的发布标志着GPU计算领域的重要转折点。作为自2006年CUDA平台诞生以来规模最大、最全面的更新,这次版本升级不仅带来了技术架构的根本性变革,更预示着AI计算范式的演进方向。本文将从技术架构、应用场景和产业影响三个维度,深入剖析这次更新的核心价值。 CUDA Tile编程模型的引入是本次更新的核心突破。传统S…

    2025年12月6日
    25400
  • AI重塑跨境电商:1688“遨虾”如何用智能体重构B2B供应链三环节

    在AI技术从概念验证迈向产业落地的关键阶段,B2B领域正成为价值创造的前沿阵地。作为中国最大的B2B供应链平台,阿里巴巴旗下1688近期推出的跨境电商AI智能体“遨虾”(alphashop.cn),标志着AI正从辅助工具升级为核心生产力引擎。本文将从技术架构、产业影响和商业逻辑三个维度,深入分析这一变革如何重构跨境电商的选品、采购、上架全流程。 **一、技术…

    2025年12月7日
    60700
  • 高通发布骁龙可穿戴平台至尊版,AI可穿戴市场规模或达十亿量级

    在今年的MWC巴塞罗那展会上,科技行业聚焦于“智能跃升”这一主题。行业趋势显示,用户已不再满足于执行单一任务的AI,开始追求能够提供高度个性化体验的专属AI智能体。这需要海量的真实情境数据作为基础,而手机、PC等终端设备因其能安全处理私密信息,被视为理想的载体。 高通进一步提出,AI需要进驻更微型化的载体,即“AI穿戴”设备,才能实现自适应、即时响应且高度个…

    2026年3月4日
    17000
  • 开源模型TOP5,被中国厂商包圆了

    10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。

    2025年10月15日
    40400
  • Vibe Coding的进化:从概念狂欢到生产级革命,百度秒哒如何定义AI编程新范式

    2025年,当Vibe Coding被《柯林斯英语词典》正式收录为年度词汇时,这项技术已经完成了从技术圈层概念到全球性现象的蜕变。从Cursor估值逼近99亿美元,到谷歌收购Windsurf核心团队推出Antigravity;从海外Claude Code、v0、Lovable的持续迭代,到国内字节Trae、阿里Qcoder、百度Comate的全面布局——整个…

    2025年12月18日
    26700