本文由第三方AI基于17173文章http://news.17173.com/content/04102026/210127495.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
再夺全球第一!百度伐谋Agent 2.0登顶MLE-Bench
2026-04-10 21:01:27
神评论
17173 新闻导语
百度伐谋Agent 2.0登顶MLE-Bench全球第一,超越Claude-Opus-4.6!采用演化策略与长程记忆,提升汽车、金融、交通等行业效率。5月13日百度AI大会正式发布,立即了解详情。
百度智能云的伐谋Agent 2.0又拿下一个世界级第一,在机器学习工程权威基准MLE-Bench上登顶,还刷新了最好成绩。
这个评测是OpenAI主导设立的,里面有75个来自Kaggle的真实工程难题,专门考验AI在数据准备、模型训练、实验运行等全流程的实战能力。
最新结果显示,在统一标准下,伐谋Agent 2.0在高难度任务上表现突出,综合得分超过了搭载Claude-Opus-4.6等主流大模型的同类智能体。
它用了更强的演化策略,可以多条路径同时探索,不对就及时调整。新增的长程记忆机制,能让AI在复杂长流程任务里保持逻辑清晰,不跑偏。
同时依托百度智能云的全栈AI基础设施,算法迭代速度更快,普通人用自然语言就能操作,不用懂复杂技术也能拿到企业级解决方案。
目前伐谋已经落地到多个行业。
在汽车制造领域,阿尔特汽车的风阻验证从小时级缩短到分钟级。
在金融风控方面,中信百信银行的模型风险区分度提升2.41%。
在交通优化上,鄂尔多斯伊金霍洛旗高峰通行时间减少一半以上。
这款智能体上线后,已经有数千家企业使用,覆盖零售、金融、制造、能源、交通等多个关键领域。
官方消息显示,5月13日到14日,在北京举办的Create2026百度AI开发者大会上,伐谋Agent 2.0会正式发布。

【来源:快科技】
热门测试游戏
- 13 分钟看懂!刚公测的《王者荣耀・世界》,到底值不值得玩?
- 2《热血传奇》上线25周年,东方幻想MMORPG鼻祖再发力
- 3砸十亿、喊 3A、对标原神,为什么大厂的开放世界全凉了?
- 4玩家质疑《影之刃零》抄袭外国!外网网友:见识少了
- 5《王者荣耀世界》超全超细的公测首发英雄一图流+养成系统详解
- 6上线四个月惨遭下架,玩家怒斥平台打压成人游戏
- 7全新竞技玩法,联动仙剑三!《剑网3》新版本定档4月23日
- 8魔兽故事:暴风城新王后定了?安度因带黑妹见“家长”,网友:毁灭吧这世界!
- 9回忆录:蹲网吧看别人玩传奇,一次拾金不昧,换来一张梦寐以求的点卡
- 103秒速配,还能双修?《逆水寒》首个情缘服4月17日开启


