本文由第三方AI基于17173文章http://news.17173.com/content/03042026/110052639.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习
2026-03-04 11:00:52
神评论
17173 新闻导语
蚂蚁集团联合清华大学发布AReaL v1.0稳定版:首个全异步训推解耦的强化学习框架,让任意Agent零改造接入RL训练,开箱即用,支持千亿参数模型。
今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打Agent一键接入RL训练,不用改代码即可兼容各类Agent框架,让智能体强化学习训练开箱即用。
近日以LangChain、Claude Code、OpenClaw为代表的智能体框架持续升温,但是还存在两大痛点。
一是接入训练成本高,现有智能体框架接口各异,每接入一个往往需要编写整套适配代码;同时多数Agent能力受限于底层模型的固定权重,部署后无法针对特定场景持续优化。
而AReaL作为首个全异步训推解耦的大模型强化学习训练系统,让Agent能在真实任务交互中获取反馈、持续优化决策。

此次发布的v1.0版本,能让任意Agent零改造接入RL训练成为现实,通过在智能体与训练系统之间加入Proxy Worker中转层,开发者只需修改一个请求地址即可接入训练。
以OpenClaw为例,开发者仅需在配置文件中将base_url和api_key指向AReaL网关,即可让智能体接入强化学习训练。
用户周期性对任务完成质量打分,AReaL后台自动完成数据采集与模型更新,使智能体在使用过程中持续进化。

该版本还推出原生训练引擎Archon,基于PyTorch实现完整的5D并行(数据并行、流水线并行、张量并行、上下文并行、专家并行),便于在不同环境中灵活部署,能够支持千亿参数级MoE模型的分布式训练。
至于未来,将继续围绕训练引擎、易用性和多模态智能体训练等方向迭代,目前AReaL v1.0的代码与文档已在inclusionAI社区开源。

【来源:快科技】
今日热点
热门测试游戏
- 1《深海迷航2》上线12小时累计销量突破200万份
- 2可永久提升属性!韩国MMO《王权与自由》全新赛季上线
- 3《权力游戏国王大道》能不能搬?如何提升战力?9小时游玩感受!
- 4韩国奇幻背景FPS新作《枪与巨龙》公开实机视频
- 5从扮演007特工到2.5D动作,5月这些新游值得一玩!
- 6暗黑4社区左右互搏:一边用新“不死”Build冲层,一边骂游戏已“坏掉”
- 7亚马逊逼开发者做AI游戏,做完了把所有懂AI的人都开了
- 8暗黑4“树的馈赠”回归,经验、金币、材料三倍速毕业?
- 9好莱坞女星艾丽·范宁穿“碎蛋”高跟鞋引发热议
- 10感谢全国网友支持!央视拿下两届世界杯版权 美加墨费用约4亿:揭秘国际足联服软原因

