小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环
小米罗福莉深度分析AI行业Token价格战,警告盲目降价将导致恶性循环。了解MiMo Token Plan如何避免Anthropic陷阱,推动高效Agent框架与模型协同发展。
4 月 7 日消息,小米集团 MiMo 负责人罗福莉昨天在 X 平台发文,谈及最近 AI 业界火热的 Token(注:词元)价格战。

罗福莉表示,Anthropic 几天前切断了 Claude 第三方工具订阅通道;并且 MiMo 也在几天前推出了 Token Plan,于是她有感而发:
1、Claude Code 的订阅机制在计算资源分配上设计得非常漂亮。但我认为它并不赚钱甚至可能亏损,除非 API 利润率高出 10 到 20 倍。
我无法精确计算第三方框架接入后带来的损失,但我仔细研究 OpenClaw 的上下文管理后发现它很糟糕。例如在一次用户请求中,OpenClaw 会触发多轮低价值的工具调用,每一次都是独立的 API 请求,而且都携带超长上下文(通常超过 10 万 tokens)。
即便有缓存命中,这种方式仍然非常浪费;在极端情况下,还会提高其他请求的缓存未命中率。
这就导致每个用户实际触发的 API 调用次数往往是 Claude Code 原生框架的数倍。换算成 API 成本很可能是订阅价格的几十倍。这已经不是“差距”,而是“巨大鸿沟”。
2、OpenClaw、OpenCode 等第三方框架仍然可以通过 API 调用 Claude,只不过不能再“搭便车”使用订阅额度。
短期来看,这些智能体的用户会感受到成本压力,费用可能轻松上涨几十倍。但这种压力会迫使上述框架优化上下文管理、提高提示词缓存命中率,减少 Token 浪费。
这种痛苦最终会转化为工程上的自律。
3、我建议各大 LLM 公司,在搞清楚如何设计一个不亏钱的编程订阅方案之前,不要盲目去打价格战。
把 Token 价格压得很低、同时完全开放第三方框架看起来对用户很友好,但这其实就陷入了 Anthropic 刚走出的陷阱。
并且更深层的问题在于,如果用户把注意力消耗在低质量 Agent 框架上,那么面对不稳定且缓慢的推理服务时,就只能使用降级过的节省成本大模型,结果仍然无法完成任务。这对于用户体验、留存来说无异于恶性循环。
4、关于 MiMo 的 Token Plan 计划:它支持第三方工具,按 Token 计费,与 Claude 新推出的额外使用套餐逻辑相同。我们的目标是长期稳定地提供高品质服务,而不是让您冲动消费后弃坑。
从宏观角度看,全球计算资源增长的脚步已跟不上 Agent 带来的 Token 需求增长。真正的出路不是提供更便宜的 Token,而是让“更高效的 Agent 框架” × “更强大且更高效的模型”协同演进。
Anthropic 的这次举措无论是否出于本意,都在推动开源、闭源生态发展,这或许是一件好事。
Agent 时代不属于消耗最多算力的人,而属于最懂得如何高效利用算力的人。

- 1MMORPG《尤弥尔传奇》上线Steam 新职业同步推出
- 2丝滑还是劝退?《梦幻西游》实装60帧引玩家争议
- 3曾经腾讯最火游戏之一,几乎QQ用户每个人都玩,停服的真相竟是…
- 4《剑星2》公布在即?开发商直言:好游戏是靠”屁股“做出来的
- 5首杀工会全团震惊!《魔兽世界》团本时隔9年再现隐藏阶段!
- 6反诈老陈四年收入暴跌90万!晒纳税单向网友自证清白
- 7《海贼王》艾尔巴夫篇首播IGN9分!巨人国直面伊姆
- 8苹果第一款折叠屏!iPhone Fold不会延期:依然9月发布
- 9律师起诉《王者荣耀》匹配机制不合理 要求公开算法!法院判了:驳回原告全部诉求
- 10ARPG《堕落之主2》新海报 性感女角大腿吸睛

