小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度
小米MiMo-V2.5系列大模型API永久降价,最高降幅99%!输入低至0.02元/百万tokens,不再区分上下文长度,Token Plan用量提升5-8倍。技术优化助力成本大降,点击了解详情。
今日,小米宣布,旗下MiMo-V2.5系列大模型API迎来永久降价。
据介绍,相比原始API定价,MiMo-V2.5系列新价格最高降幅可达99%,并且不再区分上下文窗口长度。
本次调价已于北京时间5月27日0:00正式生效,全球同步调整。
具体来看,此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。

其中,MiMo-V2.5 Pro输入缓存命中价格降至0.025元/百万tokens,最高降幅达99%;MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens,最高降幅达98%。
输出价格方面,MiMo-V2.5 Pro降至6元/百万tokens,最高降幅86%;MiMo-V2.5降至2元/百万tokens,最高降幅93%。
除了API价格下调外,MiMo的Token Plan计费体系也同步迎来重大优化。
优化后的Token Plan在加量不加价的基础上,用量提升至原来的5至8倍,同时引入Credits概念,让计费规则更清晰、更易理解。

小米称,本次价格调整背后,离不开技术团队在推理系统上的持续优化。
据了解,小米基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍,从而显著提升缓存命中率和推理效率。
同时,小米还通过优化专家并行方案、输入长度分桶策略等方式,进一步提升集群输入吞吐能力,在保障服务质量的前提下,持续降低单位token服务成本。

- 1腾讯新作翻车?主策划亲笔4000字回复,补偿玩家价值2000元道具
- 2《暗黑破坏神4》国服免费领!官宣延长到8月,永久畅玩
- 3人人都在用的OBS,怎么就成了外挂神器?
- 4《星际公民》众筹破10亿美元!5000美元概念飞船开卖!
- 5《冒险岛怀旧服》国际版测试魔术师断层第一,史莱姆王遭5000次讨伐!
- 6网友吐槽粉木耳涉嫌性暗示 盒马道歉:已下架 坚决反对低俗不良信息
- 7极境飞升,剑启新章!!《剑网一》经典版2026年度资料片今日重磅上线!
- 8传统MMO让人望而生畏?这款轻松武侠搞了新模式,把焦虑给过滤了!
- 9《剑侠情缘·零》一周年盛会将至,庆典活动首波剧透来啦!
- 10韩援COSER小花生新照!太大了以至于没法批判什么!

