本文由第三方AI基于17173文章http://news.17173.com/content/04102026/210127495.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
再夺全球第一!百度伐谋Agent 2.0登顶MLE-Bench
2026-04-10 21:01:27
神评论
17173 新闻导语
百度伐谋Agent 2.0登顶MLE-Bench全球第一,超越Claude-Opus-4.6!采用演化策略与长程记忆,提升汽车、金融、交通等行业效率。5月13日百度AI大会正式发布,立即了解详情。
百度智能云的伐谋Agent 2.0又拿下一个世界级第一,在机器学习工程权威基准MLE-Bench上登顶,还刷新了最好成绩。
这个评测是OpenAI主导设立的,里面有75个来自Kaggle的真实工程难题,专门考验AI在数据准备、模型训练、实验运行等全流程的实战能力。
最新结果显示,在统一标准下,伐谋Agent 2.0在高难度任务上表现突出,综合得分超过了搭载Claude-Opus-4.6等主流大模型的同类智能体。
它用了更强的演化策略,可以多条路径同时探索,不对就及时调整。新增的长程记忆机制,能让AI在复杂长流程任务里保持逻辑清晰,不跑偏。
同时依托百度智能云的全栈AI基础设施,算法迭代速度更快,普通人用自然语言就能操作,不用懂复杂技术也能拿到企业级解决方案。
目前伐谋已经落地到多个行业。
在汽车制造领域,阿尔特汽车的风阻验证从小时级缩短到分钟级。
在金融风控方面,中信百信银行的模型风险区分度提升2.41%。
在交通优化上,鄂尔多斯伊金霍洛旗高峰通行时间减少一半以上。
这款智能体上线后,已经有数千家企业使用,覆盖零售、金融、制造、能源、交通等多个关键领域。
官方消息显示,5月13日到14日,在北京举办的Create2026百度AI开发者大会上,伐谋Agent 2.0会正式发布。

【来源:快科技】
热门测试游戏
- 15月28日正式开测!网易《遗忘之海》最新爆料来袭:是玩法融合的野心,还是“大杂烩”的冒险?
- 2天下十八年,我们想送你一份特别的礼物
- 3看完一百张AI生成的美女图,我感觉人类文明凶多吉少了
- 4袁和平加盟《燕云十六声》任动作总顾问!蓬山、伙伴系统5月29日上线
- 510W+氪度!《燕云十六声》入坑半年!我都氪哪了?
- 6专访《逍遥江湖》老玩家亓哥:江湖十五年,是游戏,也是人生
- 7时隔多年推出新门派,《大话西游2》在520交了一份什么答卷?
- 820年老游戏还在逆生长!《梦幻西游》390万在线后再放大招
- 9《深海迷航2》发售五天销量超400万 创收超1亿美元
- 10《天国:拯救》开发商 Warhorse 官宣新作:《指环王》主题 RPG 游戏

