17173 > 游戏资讯 > 科技新闻 > 正文

小米深夜放大招!最强大模型MiMo-V2.5系列发布:能和GPT-5.4正面较量

2026-04-23 07:01:26 神评论
17173 新闻导语

小米发布MiMo-V2.5系列大模型,支持100万上下文,性能对标GPT-5.4!开源Pro版,北大编译项目4.3小时满分完成,Token效率提升50%。

今天凌晨,小米MiMo-V2.5系列大模型正式发布并开启公测,一口气推出MiMo-V2.5、V2.5-Pro、V2.5-TTS Series、V2.5-ASR四款模型。

其中,MiMo-V2.5-Pro和MiMo-V2.5还将面向全球开源。

据介绍,MiMo-V2.5-Pro专为长难Agent任务打造,支持100万上下文长度,是小米迄今最强大的模型。

在通用智能体能力、复杂软件工程以及长程任务等维度上,MiMo-V2.5-Pro已可与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型正面较量,相较上一代MiMo-V2-Pro实现全方位跃升。

在内部测试中,MiMo-V2.5-Pro结合运行框架后,可稳定完成单次近千轮工具调用的长程任务,同时在复杂指令理解与长周期逻辑一致性方面显著提升。

小米还公布了几个MiMo-V2.5-Pro实操案例,其中包括北京大学《编译原理》课程项目——用Rust实现完整的SysY编译器。

北大本科生完成该项目通常需要数周时间,而MiMo-V2.5-Pro仅用4.3小时、调用672次工具即完成全部开发,并在隐藏测试中取得233/233满分。

MiMo-V2.5则主打原生全模态Agent能力,涵盖图像、音频与视频,具备更高的平均推理速度,支持100万上下文长度。

在Claw-Eval等权威Agent评测中,MiMo-V2.5超过MiMo-V2-Pro水平,能胜任日常简单任务,同时API成本降低约50%。

此外,其跨模态推理、视频理解、图表分析等能力也迎来提升,在VideoMME、CharXiv、MMMU-Pro等评测中逼近甚至超越业界顶级闭源模型。

值得一提的是,MiMo-V2.5系列还针对Token效率进行优化,用更少的Token做更多的事。

在相同Agent基准榜单ClawEval分数情况下:

MiMo-V2.5-Pro相比Kimi K2.6节省了42%Token;

MiMo-V2.5相比Muse Spark节省50%Token。

此外,小米还全面升级模型订阅计划Token Plan,取消4倍Credits计费方式、计费不区分256k和1M上下文,并引入夜间优惠速率和自动续费模式。

【来源:快科技】
关于小米,MiMo-V2.5,大模型,GPT-5.4,Agent,开源,上下文长度,Token效率,Claude Opus 4.6,编译原理的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷