17173 > 游戏资讯 > 科技新闻 > 正文

再夺全球第一!百度伐谋Agent 2.0登顶MLE-Bench

2026-04-10 21:01:27 神评论
17173 新闻导语

百度伐谋Agent 2.0登顶MLE-Bench全球第一,超越Claude-Opus-4.6!采用演化策略与长程记忆,提升汽车、金融、交通等行业效率。5月13日百度AI大会正式发布,立即了解详情。

百度智能云的伐谋Agent 2.0又拿下一个世界级第一,在机器学习工程权威基准MLE-Bench上登顶,还刷新了最好成绩。

这个评测是OpenAI主导设立的,里面有75个来自Kaggle的真实工程难题,专门考验AI在数据准备、模型训练、实验运行等全流程的实战能力。

最新结果显示,在统一标准下,伐谋Agent 2.0在高难度任务上表现突出,综合得分超过了搭载Claude-Opus-4.6等主流大模型的同类智能体。

它用了更强的演化策略,可以多条路径同时探索,不对就及时调整。新增的长程记忆机制,能让AI在复杂长流程任务里保持逻辑清晰,不跑偏。

同时依托百度智能云的全栈AI基础设施,算法迭代速度更快,普通人用自然语言就能操作,不用懂复杂技术也能拿到企业级解决方案。

目前伐谋已经落地到多个行业。

在汽车制造领域,阿尔特汽车的风阻验证从小时级缩短到分钟级。

在金融风控方面,中信百信银行的模型风险区分度提升2.41%。

在交通优化上,鄂尔多斯伊金霍洛旗高峰通行时间减少一半以上。

这款智能体上线后,已经有数千家企业使用,覆盖零售、金融、制造、能源、交通等多个关键领域。

官方消息显示,5月13日到14日,在北京举办的Create2026百度AI开发者大会上,伐谋Agent 2.0会正式发布。

【来源:快科技】
关于伐谋Agent 2.0,百度智能云,MLE-Bench,机器学习工程,AI智能体,数据准备,模型训练,演化策略,长程记忆机制,企业级解决方案的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷