AReaL
-
边用边训:蚂蚁集团携手清华大学开源 AReaL 系统,训练 AI 推理最高提速 2.77 倍
3 月 4 日消息,蚂蚁集团携手清华大学联合推出开源强化学习训练框架 AReaL v1.0 稳定版,这是一种大规模异步强化学习系统,主要通过解耦生成与训练流程,来提升大语言模型(特别是推理模型)的训练效率。援引博文介绍,随着大语言模...[详细]
-
AReaL v1.0稳定版来了!蚂蚁联合清华大学发布:让任意Agent跑上强化学习
今天蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打Agent一键接入RL训练,不用改代码即可兼容各类Agent框架,让智能体强化学习训练开箱即用。近日以LangChain、Claude Code...[详细]